关于作者
KK-DATA 获客数据筛号平台官方内容团队。
筛号源头导出标准:CSV与通用字段规范,实现下游系统无缝对接
出海营销团队每天要处理成千上万条号码,筛号平台批量验证有效、活跃、性别,结果导出一堆CSV或TXT文件。但问题来了:导出后直接扔进CRM,字段对不上;导入数据分析工具,格式不兼容;发给业务同事,对方追问“这个tgid是什么?” 其中的核心痛点,就是筛号源头导出缺乏字段规范。本文用KK-DATA为例,详解面向CRM、EDM、私信工具的数据导出标准,涵盖csv、tgid、wsid字段映射,帮你一次导出就用得上,不再反复清洗。
为什么筛号源头导出字段标准化如此重要?
下游系统(CRM、Marketing Automation、数据中台、Telegram群发插件)对数据格式有严格的要求。字段名大小写、分隔符、布尔值表示法稍有偏差,就需要手动或写脚本转换。一个10万条的筛号结果,清洗工作往往需要2-3小时,部分团队甚至因此放弃使用更细致的性别/活跃度标签,只保留最简单的“有效/无效”,浪费了筛号平台的深度能力。
标准化导出带来三个直接好处:
- 自动映射:CRM导入时,字段名和数据格式直接匹配,无需中间表。
- 减少人工:清洗时间从小时级降到分钟级(只需检查文件编码和分隔符)。
- 提高ROI:筛号花的每一分钱,都转化为可直接使用的结构化数据。
筛号源头常见的导出字段一览(csv、txt)
无论用哪个筛号平台,导出文件都包含一组核心字段。下面是基于KK-DATA和行业通用实践的字段清单,以及它们的业务含义和格式示例。
| 字段名(英文常用) | 业务含义 | 格式示例 | 常见问题 |
|---|---|---|---|
| phone / phone_number | 完整国际号码(带+号) | +8613800138000 | 有些平台去掉+,下游CRM可能需要补全 |
| country_code | 国际区号(数字,不含+) | 86 | 用于分国家统计 |
| iso_country | ISO二位国家代码 | CN | 区分数据源的国籍标签 |
| tgid | Telegram内部唯一ID(数字) | 1234567890 | 用于TG私信SDK调用,不是手机号 |
| wsid | WhatsApp内部ID | [email protected] | 用于WhatsApp Business API |
| status | 号码状态(有效/无效/未知) | valid / invalid / unknown | 部分平台输出 1/0 |
| active_days | 最近活跃天数(Telegram) | 15 | 精确整数或区间(如15-30) |
| gender | 基于头像的性别识别(Telegram) | male / female / unknown | 不同平台可能用M/F/U |
| check_time | 检测时间戳(UTC+8) | 2024-01-15 10:30:00 | 注意时区对齐 |
| platform | 检测平台 | telegram / whatsapp / imessage | 多平台任务时区分 |
平台专用字段:tgid、wsid的定位与导出意义
- tgid:Telegram用户唯一数字ID。它不等于手机号,但可用于Telegram群发机器人的sendMessage接口。导出tgid后,配合API可直接向用户发私信,无需存手机号。
- wsid:WhatsApp内部ID,格式通常为
[email protected]。这是WhatsApp Business API要求的标准标识,用于发送消息或查询状态。筛号时检测到号码有效,同时导出wsid即可直接对接发送系统。 - 这两个字段不是所有场景都需要。如果仅做号码有效性验证,不涉及后续主动推送,可以不导出。
号码状态字段:有效、活跃、性别识别的导出标签规范
- 有效(Status):至少代表该号码已注册对应平台。建议使用
valid / invalid,不推荐用yes/no,因为下游系统常对布尔值有歧义。 - 活跃(active_days):反映该用户近期是否有在线行为。KK-DATA支持7天、15天、30天等窗口,导出值通常是一个整数(如
7代表7天内活跃)。部分场景更喜欢区间标签(7d_active),但标准做法是精确天数。 - 性别(gender):基于头像识别,不是100%准确,但可用于定向画像。建议导出
male / female / unknown,便于后续分析。
常见格式陷阱
注意:有些筛号平台将“有效”导出为“1/0”,而另一些为“true/false”。如果你的CRM只认“1/0”,就需要在导入前做文本替换。在导出前预览文件,确认字段格式是关键。
如何规划导出字段以适配下游系统?
在创建筛号任务时,不要全选所有可用字段,而是根据目标系统“精简搭配”。以下常见场景的字段推荐:
| 下游场景 | 推荐导出字段 | 原因 |
|---|---|---|
| Telegram群发(TG bot) | phone, tgid, status, active_days | tgid是发信所需,活跃度决定是否打扰 |
| WhatsApp CRM导入 | phone, wsid, status, country_code | wsid用于自动匹配WhatsApp联系人 |
| 数据分析/用户画像 | phone, gender, active_days, country_code, check_time | 需要多维标签做交叉分析 |
| 批量营销邮件(EDM) | phone (作为唯一标识), status, gender | 仅需平台有效状态和性别,减少字段负担 |
下游系统对字段格式的常见要求
- CRM(如HubSpot、Salesforce):大多使用CSV导入,字段名需与CRM对象字段名完全一致(区分大小写),空值需用空字符串或NULL表示。
- 数据库(MySQL/PostgreSQL):时间戳建议用
YYYY-MM-DD HH:MM:SS格式,数值字段不要带千分位逗号,布尔值用0/1。 - 报表工具(Tableau、Power BI):喜欢宽表结构,每个维度一列,但避免大量重复空值。活跃度字段建议保留原始整数,让可视化工具自行分组。
避免字段冗余:如何只导出真正需要的列
核心理念:导出时用不到的信息就是噪音。KK-DATA在创建任务时允许自定义导出列,你可以取消勾选不需要的字段(如tgid、wsid甚至phone本身)。例如只做活跃度分析,可以勾选phone+active_days+country_code,其余略过。这样生成的文件体积小、字段少,导入任何系统都更清晰。
操作建议:
- 在控制台任务创建页,进入“导出设置”选项卡。
- 按需勾选、排序字段。
- 预览前2行文件,确认字段顺序和格式。
- 保存导出模板,下次重复使用。
导出后的数据清洗与字段映射实操
拿到CSV文件后,通常还需要两到三步简单处理才能直接导入下游系统。以下为标准操作流程:
步骤1:去除BOM与特殊字符
用Notepad++或VSCode将编码转为UTF-8 without BOM。某些CRM(如Zoho)会因BOM报错。
步骤2:统一时间戳格式
如果下游要求ISO 8601(2024-01-15T10:30:00Z),而导出是2024-01-15 10:30:00,可用Excel或小脚本转换。
步骤3:布尔值转换
valid/invalid → 1/0(用替换功能或公式=IF(A2="valid",1,0))。
步骤4:字段名映射
将筛号平台的字段名改为下游系统期望的名称。例如,KK-DATA导出phone,CRM要求Phone,直接在CSV表头修改。
步骤5:验证数据完整性
检查是否有空行、错位、乱码。尤其注意手机号是否带+号,以及国家代码是否一致。
最佳实践
直接在KK-DATA控制台勾选字段时,将字段名改为与下游系统一致,是最高效的方法。但需注意,字段名长度不要超过32字符(CRM常有限制)。
数据去重仓库与字段一致性:打通多任务导出的关键
多批次筛号时,同一个号码可能出现在不同任务(例如先筛Telegram,后筛WhatsApp)。如果两个导出的字段格式不同(比如第一次用valid,第二次用active),合并后去重就变得复杂。
KK-DATA的数据去重仓库,能保证同一号码跨任务保持字段标准一致。当你首次导出的字段名和格式被存入仓库后,后续所有包含该号码的任务,均按首次的字段结构输出。这意味着你只需要在第一次任务中精心设计字段模板,后面所有任务都能自动对齐。
去重仓库字段默认对齐建议
建议在首次任务时,使用与下游系统一致的字段命名,包括大小写。例如CRM中字段为Phone、Status、Gender,就在筛号任务导出设置中同样命名。这样无论多少次筛号,去重仓库始终输出统一格式,无需额外映射。
筛号源头导出标准的最佳实践检查清单
按以下步骤执行,可确保每次导出的数据都能直接使用:
- 明确下游系统支持的文件格式:CSV还是TXT?分隔符是逗号、制表符还是竖线?
- 确认是否需要tgid/wsid导出:如果只做号码有效性统计,这两个字段可不勾选。
- 比照下游系统字段名:列字段名是否完全一致(包括大小写)?若不支持,导出后手动改表头。
- 预览文件:导出前用控制台的文件预览功能,检查列顺序与格式。
- 激活数据去重仓库:在KK-DATA个人设置中开启去重,并确保第一次任务字段对齐。
- 首次测试:先用10条号码测试导出,导入下游系统验证是否报错,确认无误后再跑全量任务。
- 保存导出模板:在控制台将常用组合保存为模板,后续任务一键应用,避免重复配置。
常见问题
问:筛号源头导出标准是什么意思?我为什么要关注它?
答: 指从筛号平台(如KK-DATA)导出结果时,字段名称、数值格式与长度是否符合下游系统(如CRM字段库、API对接要求)的规范。关注它,能避免每次收到筛号结果都要手动映射、转换,减少80%以上的清洗工作。
问:筛号源头导出字段可以自定义吗?比如我只导出tgid和活跃度。
答: 可以。在KK-DATA控制台创建任务时,你可以在“导出字段选项”中勾选需要的内容(包括tgid、wsid、性别、活跃度等),未勾选的字段则不会出现在csv/txt文件中,显著减轻后续字段映射负担。
问:tgid与wsid导出后,能直接用于Telegram群发和WhatsApp营销吗?
答: tgid和wsid通常用于私信SDK或接口调用,而非直接作为“手机号”发送。你需要将导出的tgid/wsid导入到支持该ID的发送工具中(如TG机器人、WhatsApp Business API脚本)。筛号本身不负责发送操作。
问:007data和KK-DATA在导出字段标准化方面有什么差异?
答: 007data也提供类似的csv导出,但各家字段命名可能不同(例如“性别”可能写为“gender” vs “sex”)。KK-DATA在控制台内置了完善的字段解释说明、映射建议以及数据去重仓库,能确保跨任务导出字段一致,降低清洗成本。具体计费以官网为准。
问:我的CRM只接受“1/0”的用户状态值,但是筛号导出了“active/inactive”,怎么办?
答: 这是常见的不兼容问题。建议在筛号任务导出页使用字段映射功能(如有)或在导出后用公式/脚本将文本转换为整型;常规做法是修改csv表头并添加转换列。如果你能提前选择布尔值输出格式(部分平台支持自定义),请预先设定为0/1。
本文撰写时参考了KK-DATA官方文档及控制台最新版本。如需查看实时单价与导出效果,请登录应用控制台或联系客服 @kkdata_cc。
Related Articles
筛号源头 10 问 10 答:Telegram/WhatsApp 筛号常见问题终极指南(2025)
从号码生成到活跃检测,一文讲透筛号源头。覆盖Telegram/WhatsApp筛号原理、计费模式、平台对比、数据安全等10个核心FAQ。含007data、thdata、KK-DATA等工具客观对比,助你选择最高效的获客筛号方案。
全球号码生成源头:从零构建出海获客的筛号流水线
掌握全球号码生成源头,轻松搭建Telegram、WhatsApp筛号流水线。KK-DATA提供240+国家号码生成服务(免费),与跨平台筛号无缝衔接,助你高效验证号码有效性与活跃度。本文详解号段策略、生成→筛选→导出路径及避坑指南,适合出海营销与社群运营团队。
筛号源头去重攻略:跨任务去重仓库如何为出海获客节省 30% 成本
筛号源头去重是批量号码验证的关键环节。本文解析KK-DATA去重仓库如何实现跨任务去重,避免重复检测浪费余额,为出海团队节省真实成本。适合Telegram、WhatsApp筛号场景,附常见问题与最佳实践。