KK-DATA avatar KK-DATA

筛号源头导出标准:CSV与通用字段规范,实现下游系统无缝对接

筛号源头 导出 kkdata 字段规范

筛号源头导出标准:CSV与通用字段规范,实现下游系统无缝对接

出海营销团队每天要处理成千上万条号码,筛号平台批量验证有效、活跃、性别,结果导出一堆CSV或TXT文件。但问题来了:导出后直接扔进CRM,字段对不上;导入数据分析工具,格式不兼容;发给业务同事,对方追问“这个tgid是什么?” 其中的核心痛点,就是筛号源头导出缺乏字段规范。本文用KK-DATA为例,详解面向CRM、EDM、私信工具的数据导出标准,涵盖csv、tgid、wsid字段映射,帮你一次导出就用得上,不再反复清洗。


为什么筛号源头导出字段标准化如此重要?

下游系统(CRM、Marketing Automation、数据中台、Telegram群发插件)对数据格式有严格的要求。字段名大小写、分隔符、布尔值表示法稍有偏差,就需要手动或写脚本转换。一个10万条的筛号结果,清洗工作往往需要2-3小时,部分团队甚至因此放弃使用更细致的性别/活跃度标签,只保留最简单的“有效/无效”,浪费了筛号平台的深度能力。

标准化导出带来三个直接好处:

  • 自动映射:CRM导入时,字段名和数据格式直接匹配,无需中间表。
  • 减少人工:清洗时间从小时级降到分钟级(只需检查文件编码和分隔符)。
  • 提高ROI:筛号花的每一分钱,都转化为可直接使用的结构化数据。

筛号源头常见的导出字段一览(csv、txt)

无论用哪个筛号平台,导出文件都包含一组核心字段。下面是基于KK-DATA和行业通用实践的字段清单,以及它们的业务含义和格式示例。

字段名(英文常用)业务含义格式示例常见问题
phone / phone_number完整国际号码(带+号)+8613800138000有些平台去掉+,下游CRM可能需要补全
country_code国际区号(数字,不含+)86用于分国家统计
iso_countryISO二位国家代码CN区分数据源的国籍标签
tgidTelegram内部唯一ID(数字)1234567890用于TG私信SDK调用,不是手机号
wsidWhatsApp内部ID[email protected]用于WhatsApp Business API
status号码状态(有效/无效/未知)valid / invalid / unknown部分平台输出 1/0
active_days最近活跃天数(Telegram)15精确整数或区间(如15-30)
gender基于头像的性别识别(Telegram)male / female / unknown不同平台可能用M/F/U
check_time检测时间戳(UTC+8)2024-01-15 10:30:00注意时区对齐
platform检测平台telegram / whatsapp / imessage多平台任务时区分

平台专用字段:tgid、wsid的定位与导出意义

  • tgid:Telegram用户唯一数字ID。它不等于手机号,但可用于Telegram群发机器人的sendMessage接口。导出tgid后,配合API可直接向用户发私信,无需存手机号。
  • wsid:WhatsApp内部ID,格式通常为[email protected]。这是WhatsApp Business API要求的标准标识,用于发送消息或查询状态。筛号时检测到号码有效,同时导出wsid即可直接对接发送系统。
  • 这两个字段不是所有场景都需要。如果仅做号码有效性验证,不涉及后续主动推送,可以不导出。

号码状态字段:有效、活跃、性别识别的导出标签规范

  • 有效(Status):至少代表该号码已注册对应平台。建议使用valid / invalid,不推荐用yes/no,因为下游系统常对布尔值有歧义。
  • 活跃(active_days):反映该用户近期是否有在线行为。KK-DATA支持7天、15天、30天等窗口,导出值通常是一个整数(如7代表7天内活跃)。部分场景更喜欢区间标签(7d_active),但标准做法是精确天数。
  • 性别(gender):基于头像识别,不是100%准确,但可用于定向画像。建议导出male / female / unknown,便于后续分析。

常见格式陷阱

注意:有些筛号平台将“有效”导出为“1/0”,而另一些为“true/false”。如果你的CRM只认“1/0”,就需要在导入前做文本替换。在导出前预览文件,确认字段格式是关键。


如何规划导出字段以适配下游系统?

在创建筛号任务时,不要全选所有可用字段,而是根据目标系统“精简搭配”。以下常见场景的字段推荐:

下游场景推荐导出字段原因
Telegram群发(TG bot)phone, tgid, status, active_daystgid是发信所需,活跃度决定是否打扰
WhatsApp CRM导入phone, wsid, status, country_codewsid用于自动匹配WhatsApp联系人
数据分析/用户画像phone, gender, active_days, country_code, check_time需要多维标签做交叉分析
批量营销邮件(EDM)phone (作为唯一标识), status, gender仅需平台有效状态和性别,减少字段负担

下游系统对字段格式的常见要求

  • CRM(如HubSpot、Salesforce):大多使用CSV导入,字段名需与CRM对象字段名完全一致(区分大小写),空值需用空字符串或NULL表示。
  • 数据库(MySQL/PostgreSQL):时间戳建议用YYYY-MM-DD HH:MM:SS格式,数值字段不要带千分位逗号,布尔值用0/1。
  • 报表工具(Tableau、Power BI):喜欢宽表结构,每个维度一列,但避免大量重复空值。活跃度字段建议保留原始整数,让可视化工具自行分组。

避免字段冗余:如何只导出真正需要的列

核心理念:导出时用不到的信息就是噪音。KK-DATA在创建任务时允许自定义导出列,你可以取消勾选不需要的字段(如tgid、wsid甚至phone本身)。例如只做活跃度分析,可以勾选phone+active_days+country_code,其余略过。这样生成的文件体积小、字段少,导入任何系统都更清晰。

操作建议:

  1. 在控制台任务创建页,进入“导出设置”选项卡。
  2. 按需勾选、排序字段。
  3. 预览前2行文件,确认字段顺序和格式。
  4. 保存导出模板,下次重复使用。

导出后的数据清洗与字段映射实操

拿到CSV文件后,通常还需要两到三步简单处理才能直接导入下游系统。以下为标准操作流程:

步骤1:去除BOM与特殊字符
用Notepad++或VSCode将编码转为UTF-8 without BOM。某些CRM(如Zoho)会因BOM报错。

步骤2:统一时间戳格式
如果下游要求ISO 8601(2024-01-15T10:30:00Z),而导出是2024-01-15 10:30:00,可用Excel或小脚本转换。

步骤3:布尔值转换
valid/invalid1/0(用替换功能或公式=IF(A2="valid",1,0))。

步骤4:字段名映射
将筛号平台的字段名改为下游系统期望的名称。例如,KK-DATA导出phone,CRM要求Phone,直接在CSV表头修改。

步骤5:验证数据完整性
检查是否有空行、错位、乱码。尤其注意手机号是否带+号,以及国家代码是否一致。

最佳实践

直接在KK-DATA控制台勾选字段时,将字段名改为与下游系统一致,是最高效的方法。但需注意,字段名长度不要超过32字符(CRM常有限制)。


数据去重仓库与字段一致性:打通多任务导出的关键

多批次筛号时,同一个号码可能出现在不同任务(例如先筛Telegram,后筛WhatsApp)。如果两个导出的字段格式不同(比如第一次用valid,第二次用active),合并后去重就变得复杂。

KK-DATA的数据去重仓库,能保证同一号码跨任务保持字段标准一致。当你首次导出的字段名和格式被存入仓库后,后续所有包含该号码的任务,均按首次的字段结构输出。这意味着你只需要在第一次任务中精心设计字段模板,后面所有任务都能自动对齐。

去重仓库字段默认对齐建议

建议在首次任务时,使用与下游系统一致的字段命名,包括大小写。例如CRM中字段为PhoneStatusGender,就在筛号任务导出设置中同样命名。这样无论多少次筛号,去重仓库始终输出统一格式,无需额外映射。


筛号源头导出标准的最佳实践检查清单

按以下步骤执行,可确保每次导出的数据都能直接使用:

  • 明确下游系统支持的文件格式:CSV还是TXT?分隔符是逗号、制表符还是竖线?
  • 确认是否需要tgid/wsid导出:如果只做号码有效性统计,这两个字段可不勾选。
  • 比照下游系统字段名:列字段名是否完全一致(包括大小写)?若不支持,导出后手动改表头。
  • 预览文件:导出前用控制台的文件预览功能,检查列顺序与格式。
  • 激活数据去重仓库:在KK-DATA个人设置中开启去重,并确保第一次任务字段对齐。
  • 首次测试:先用10条号码测试导出,导入下游系统验证是否报错,确认无误后再跑全量任务。
  • 保存导出模板:在控制台将常用组合保存为模板,后续任务一键应用,避免重复配置。

常见问题

问:筛号源头导出标准是什么意思?我为什么要关注它?
答: 指从筛号平台(如KK-DATA)导出结果时,字段名称、数值格式与长度是否符合下游系统(如CRM字段库、API对接要求)的规范。关注它,能避免每次收到筛号结果都要手动映射、转换,减少80%以上的清洗工作。

问:筛号源头导出字段可以自定义吗?比如我只导出tgid和活跃度。
答: 可以。在KK-DATA控制台创建任务时,你可以在“导出字段选项”中勾选需要的内容(包括tgid、wsid、性别、活跃度等),未勾选的字段则不会出现在csv/txt文件中,显著减轻后续字段映射负担。

问:tgid与wsid导出后,能直接用于Telegram群发和WhatsApp营销吗?
答: tgid和wsid通常用于私信SDK或接口调用,而非直接作为“手机号”发送。你需要将导出的tgid/wsid导入到支持该ID的发送工具中(如TG机器人、WhatsApp Business API脚本)。筛号本身不负责发送操作。

问:007data和KK-DATA在导出字段标准化方面有什么差异?
答: 007data也提供类似的csv导出,但各家字段命名可能不同(例如“性别”可能写为“gender” vs “sex”)。KK-DATA在控制台内置了完善的字段解释说明、映射建议以及数据去重仓库,能确保跨任务导出字段一致,降低清洗成本。具体计费以官网为准。

问:我的CRM只接受“1/0”的用户状态值,但是筛号导出了“active/inactive”,怎么办?
答: 这是常见的不兼容问题。建议在筛号任务导出页使用字段映射功能(如有)或在导出后用公式/脚本将文本转换为整型;常规做法是修改csv表头并添加转换列。如果你能提前选择布尔值输出格式(部分平台支持自定义),请预先设定为0/1。


本文撰写时参考了KK-DATA官方文档及控制台最新版本。如需查看实时单价与导出效果,请登录应用控制台或联系客服 @kkdata_cc