KK-DATA avatar KK-DATA

筛号导出字段表完整指南:数据字典与术语说明(KK-DATA 平台)

导出 字段 kkdata 数据字典

筛号导出字段表完整指南:数据字典与术语说明(KK-DATA 平台)

当你从 KK-DATA 平台下载筛选结果时,看到的 CSV 或 TXT 文件中每一列都有特定含义。不理解这些字段,很容易误判号码质量、浪费营销预算。本文为你系统梳理 筛号导出字段表,涵盖 Telegram、WhatsApp、iMessage、RCS 等平台的常见字段、状态值定义与使用场景,帮助你像数据运营专家一样快速读懂导出结果。

无论你正在进行出海获客、社群运营还是私信推广,掌握这份 数据字典 都能提升后续数据处理效率,避免因术语混淆导致的决策失误。


一、为什么需要理解筛号导出字段?

筛选结果不是简单的“有效/无效”二元判断。一个号码可能已注册 Telegram 但长期未活跃,也可能注册了 WhatsApp 却未绑定 iMessage。如果直接使用未筛选的数据进行群发,可能导致:

  • 大量消息发送失败,影响账号信誉
  • 触达的并非目标活跃用户,转化率低下
  • 无法精准区分性别导向的营销内容

导出字段表就是将原始检测数据转化为可读、可分析的结构化信息。理解每个字段的含义,才能基于真实状态做后续操作,例如将“tg有效”的号码导入群发工具,将“tg活跃30天”的号码用于高价值活动通知。


二、导出字段速查总览

KK-DATA 的导出数据通常分为四大类字段,下表概述了常见字段群组:

分类字段示例说明
平台标识platformcountry_codenumber号码归属平台、国家代码、原始号码
状态检测telegram_statuswhatsapp_statusactive_level各平台注册/有效/活跃检测结果
用户属性tgidwsidgenderlast_active_days用户唯一标识、性别预测、活跃天数
辅助信息task_iddetect_timededup_keyestimated_cost任务溯源、去重标记、费用预估

不同检测类型下,导出字段的命名和数量可能有所不同,但核心逻辑一致。接下来逐类详解。

字段含义以控制台实时显示为准

不同检测类型的字段命名可能随版本更新调整,建议以 应用控制台 实际导出数据为准,并参考 使用文档 中的最新说明。

1. 平台标识字段

  • number:原始手机号,通常包含国家代码(如 +8613800138000)。
  • country_code:国家代码(如 86),用于筛选特定国家号码。
  • platform:检测的平台类型,枚举值如 telegramwhatsappimessagercs。注意:一次筛号任务可能针对某一平台,但导出结果中该字段统一标记平台。

2. 状态检测字段

  • telegram_status:是否在 Telegram 注册(开通/未开通)。
  • telegram_effective:是否可被搜索/联系(有效/无效)。
  • telegram_active:活跃等级(如活跃7天/15天/30天)。
  • whatsapp_status:是否注册 WhatsApp(开通/未开通)。
  • imessage_status:是否激活 iMessage(启用/未启用)。
  • rcs_status:是否支持 RCS(支持/不支持)。
  • active_level:综合活跃度指标(如 high/medium/low)。

3. 用户属性字段与辅助信息

  • tgid:Telegram 用户唯一 ID(数字串),可用于精准定向。
  • wsid:WhatsApp 用户唯一标识(Base64 编码字符串)。
  • genderpredicted_gender:基于头像和昵称预测的性别(male/female/unknown)。
  • last_active_days:最近活跃距离检测时的天数(如 5 表示5天前活跃)。
  • detect_time:检测任务完成时间戳(UTC)。
  • task_id:所属任务编号,用于跨任务数据关联。
  • dedup_key:去重仓库中的记录键,便于识别重复号码。
  • estimated_cost:任务提交前的预估费用(数值,单位元)。
  • actual_cost:任务完成后的实际扣费金额。

三、平台标识字段详解

1. Telegram 相关字段

Telegram 筛号是出海营销最常见场景,导出字段也最丰富。

  • telegram_status:取值“开通”或“未开通”。开通仅表示该号码在 Telegram 注册过,但不保证当前可联系(如已注销或封号)。
  • telegram_effective:取值“有效”或“无效”。有效表示号码当前可被搜索并发送消息(未注销、未因违规被限制)。注意:有效不一定活跃。
  • telegram_active:基于登录时间判断的活跃等级。常见窗口:7天、15天、30天。例如“active_7d”表示7天内有登录行为。该字段仅在提交了活跃检测任务时出现。
  • tgid:Telegram 用户唯一数字 ID,可用来导入 TG 群发工具进行精确发送,避免号码格式错误导致失败。
  • telegram_gender:通过头像、昵称等公开信息推测的性别,字段名为 telegram_gender 或统一 gender。取值 malefemaleunknown

2. WhatsApp 相关字段

  • whatsapp_status:取值“有效”或“未检测”。有效表示该号码已在 WhatsApp 注册并能接收消息(未过期、未注销)。
  • wsid:WhatsApp 用户内部标识符(通常为 Base64 字符串)。导出后可将其与号码绑定,用于跨设备或跨会话的精准推送,避免因号码变更导致的丢失。

3. iMessage 与 RCS 相关字段

iMessage 和 RCS 的检测字段命名类似,但状态值略有不同。

  • imessage_status:取值“启用”或“未启用”。启用表示该 Apple ID/号码已激活 iMessage 功能。
  • rcs_status:取值“支持”或“不支持”。RCS(富通信服务)是运营商提供的增强短信协议,部分国家已普及。此外可能包含 operator_info 字段,显示运营商名称(如 T-Mobile、Verizon),方便判断号码归属运营商。

四、状态检测字段详解

理解“开通”“有效”“活跃”三者的差异,是高效使用筛号工具的关键。

1. 开通状态 vs 有效状态

字段含义典型场景
telegram_status = 开通号码在 Telegram 注册过初步筛选,批量加好友
telegram_effective = 有效当前可被搜索并发送消息向已验证号码发起冷启动私信
whatsapp_status = 有效可接收 WhatsApp 消息导入 WhatsApp 群发工具

注意:一个号码可能显示开通但无效(例如已注销账户),也可能有效但长期不活跃。营销时应优先使用有效字段,若追求高触达率则再叠加活跃度过滤。

2. 活跃度状态与窗口设置

活跃检测需要指定时间窗口,常见选项有7天、15天、30天。导出结果中的字段 last_active_days 直接给出具体天数,而 active_window 字段(如果存在)则记录任务中设置的窗口值。

  • 若窗口设为15天,则只有15天内有登录行为的号码会被标记为“活跃15天”。
  • 7天窗口的活跃号码转化率通常高于30天窗口,但数量更少。可根据营销目的选择:高转化活动用7天活跃,品牌曝光类活动可用30天活跃

3. 性别识别状态

性别预测字段 genderpredicted_gender 的准确率取决于 Telegram 公开信息(头像、昵称)的丰富程度。一般来说,有清晰头像和典型姓名的号码准确率可达70%~80%,但不应作为唯一判定标准。建议结合活跃度与目标市场特性综合使用。


五、用户属性字段与辅助信息

1. TGID 与 WSID 的导出意义

  • TGID(Telegram ID):每个 Telegram 用户拥有唯一数字 ID。导出后,你可以用这个 ID 直接向用户发送消息(通过 Bot API),而不依赖手机号码。这对于号码已更换或无法发送 SMS 的用户场景非常有用。
  • WSID(WhatsApp ID):WhatsApp 用户内部标识符。同样可用于精准发送,尤其在 WSID 绑定后即使号码变更也能定位到同一用户。将 WSID 和号码一并导出,导入群发工具时不仅能提高到达率,还能减少因号码格式错误导致的失败。

2. 性别预测与活跃天数

  • 性别字段取值:malefemaleunknown。注意:部分号码因信息不足会返回 unknown,不应视为无效数据。
  • 活跃天数字段 active_days 表示距最近一次登录的天数。例如 active_days=3 意味着该号码3天前有登录行为。该字段比窗口等级更精确,可用于按天数区间做二次筛选。

3. 数据去重仓库与导出标记

如果你多次提交筛号任务,重复的号码会被自动去重,避免重复扣费。导出结果中的 dedup_key 字段表示去重仓库中的记录标识,task_id 则标记该条记录所属的任务。你可以通过这两个字段追溯数据来源,或在后续处理中合并多个任务的结果。


六、导出字段与计费的关系

KK-DATA 采用按条计费模式,不同检测类型单价不同。导出数据中通常包含费用相关字段:

  • estimated_cost:任务提交前显示的预估费用(单位:元),实际扣费可能因去重等因素略有变化。
  • actual_cost:任务完成后实际扣除的余额。可在导出 CSV 中查看每条号码的检测成本(部分任务可能不逐条记录,仅显示合计)。

重要:免费号码生成(全球号码生成)不扣费,只有在线筛号任务按检测条数扣费。提交任务前务必在控制台确认预估费用,确保余额充足。

请注意不同检测类型的单价差异

Telegram、WhatsApp、iMessage 等平台的检测单价不同,活跃度检测与简单开通检测单价也可能不同。提交任务前请查看 计费说明 或控制台显示的预估值,避免余额不足导致任务失败。


七、字段误读与注意事项

常见误区总结如下,避免你在数据分析中走弯路:

  1. 有效 ≠ 活跃:一个号码有效(可联系)但可能已半年未登录,收到消息的概率很低。应同时参考活跃度字段。
  2. 性别预测仅作参考:头像和昵称可能具有误导性(如用卡通形象),建议对高价值营销活动组合使用活跃度等其他维度。
  3. tgid 与号码并非一对一:用户可能更换手机号,但 tgid 不变。导出 tgid 后应以此为准进行后续操作,而非依赖号码。
  4. 去重仓库的 dedup_key 不可跨任务复用:每条任务都有独立去重逻辑,不同任务间 dedup_key 不保证唯一。
  5. 活跃天数计算基于平台登录记录:如果用户在线但不发送消息,可能仍会被记录为活跃,这是正常现象。

常见问题

问:tg有效和tg活跃有什么区别?

答:tg有效检测判断该号码是否已在 Telegram 注册且当前可被搜索或联系;tg活跃检测则在有效基础上进一步判断用户在过去指定窗口(如7天/15天/30天)内是否有登录行为。活跃检测消耗的余额通常更高,适用于需要高触达率的营销场景。

问:如何判断一个号码是否开通了 WhatsApp?

答:在导出结果中查看 whatsapp_status 字段,取值为“开通”或“有效”表示该号码已注册 WhatsApp 并可接收消息;若为“未开通”或“未检测”,则需要重新提交检测任务。

问:WSID 导出有什么作用?

答:WSID 是 WhatsApp 用户的内部唯一标识符,可用于精准定向发送消息,避免号码变更后无法定位同一用户。将 WSID 导入群发工具可提高消息到达率,减少因号码格式问题导致的发送失败。

问:导出 CSV 中的 last_active_days 字段如何解读?

答:该字段表示距离检测完成时间最近一次活跃的天数。例如 last_active_days=3 表示该号码 3 天前有登录行为。该数据来自平台提供的最后在线时间戳,精确到天。如果字段为空或 null,可能意味着号码有效但无法获取具体活跃天数(如隐私设置限制)。

问:性别字段准确率有多高?对营销有帮助吗?

答:性别预测基于 Telegram 公开的头像和昵称文本分析,准确率约 70%~80%,具体因地区和文化差异而异。可作为辅助参考,但不建议作为唯一筛选条件。对于需要精准性别定向的营销(如女性用品、男性服饰),建议先用活跃度过滤出高质量用户,再结合性别字段做最后分组。


下一步行动

  • 登录 应用控制台 查看你的筛号任务导出数据,对照本文理解每个字段。
  • 查阅完整 使用文档 获取更多字段示例。
  • 如果你还有疑问,可直接联系客服 Telegram @kkdata_cc 获得帮助。

本文帮助你理清筛号导出字段表的完整数据字典与术语说明。掌握这些概念,你将能更高效地利用筛选结果,提升出海获客的 ROI。