KK-DATA avatar KK-DATA

篩號源頭導出標準:CSV與通用欄位規範,實現下游系統無縫對接

筛号源头 导出 kkdata 字段规范

篩號源頭導出標準:CSV與通用欄位規範,實現下游系統無縫對接

出海行銷團隊每天要處理成千上萬條號碼,篩號平台批量驗證有效、活躍、性別,結果導出一堆CSV或TXT檔案。但問題來了:導出後直接扔進CRM,欄位對不上;導入數據分析工具,格式不相容;發給業務同事,對方追問「這個tgid是什麼?」 其中的核心痛點,就是篩號源頭導出缺乏欄位規範。本文用KK-DATA為例,詳解面向CRM、EDM、私信工具的數據導出標準,涵蓋csv、tgid、wsid欄位映射,幫你一次導出就用得上,不再反覆清洗。


為什麼篩號源頭導出欄位標準化如此重要?

下游系統(CRM、Marketing Automation、數據中台、Telegram群發插件)對數據格式有嚴格的要求。欄位名大小寫、分隔符、布林值表示法稍有偏差,就需要手動或寫腳本轉換。一個10萬條的篩號結果,清洗工作往往需要2-3小時,部分團隊甚至因此放棄使用更細緻的性別/活躍度標籤,只保留最簡單的「有效/無效」,浪費了篩號平台的深度能力。

標準化導出帶來三個直接好處:

  • 自動映射:CRM導入時,欄位名和數據格式直接匹配,無需中間表。
  • 減少人工:清洗時間從小時級降到分鐘級(只需檢查檔案編碼和分隔符)。
  • 提高ROI:篩號花的每一分錢,都轉化為可直接使用的結構化數據。

篩號源頭常見的導出欄位一覽(csv、txt)

無論用哪個篩號平台,導出檔案都包含一組核心欄位。下面是基於KK-DATA和行業通用實踐的欄位清單,以及它們的業務含義和格式範例。

欄位名(英文常用)業務含義格式範例常見問題
phone / phone_number完整國際號碼(帶+號)+8613800138000有些平台去掉+,下游CRM可能需要補全
country_code國際區號(數字,不含+)86用於分國家統計
iso_countryISO二位國家代碼CN區分數據源的國籍標籤
tgidTelegram內部唯一ID(數字)1234567890用於TG私信SDK調用,不是手機號
wsidWhatsApp內部ID[email protected]用於WhatsApp Business API
status號碼狀態(有效/無效/未知)valid / invalid / unknown部分平台輸出 1/0
active_days最近活躍天數(Telegram)15精確整數或區間(如15-30)
gender基於頭像的性別識別(Telegram)male / female / unknown不同平台可能用M/F/U
check_time檢測時間戳(UTC+8)2024-01-15 10:30:00注意時區對齊
platform檢測平台telegram / whatsapp / imessage多平台任務時區分

平台專用欄位:tgid、wsid的定位與導出意義

  • tgid:Telegram用戶唯一數字ID。它不等於手機號,但可用於Telegram群發機器人的sendMessage接口。導出tgid後,配合API可直接向用戶發私信,無需存手機號。
  • wsid:WhatsApp內部ID,格式通常為[email protected]。這是WhatsApp Business API要求的標準標識,用於發送訊息或查詢狀態。篩號時檢測到號碼有效,同時導出wsid即可直接對接發送系統。
  • 這兩個欄位不是所有場景都需要。如果僅做號碼有效性驗證,不涉及後續主動推送,可以不導出。

號碼狀態欄位:有效、活躍、性別識別的導出標籤規範

  • 有效(Status):至少代表該號碼已註冊對應平台。建議使用valid / invalid,不推薦用yes/no,因為下游系統常對布林值有歧義。
  • 活躍(active_days):反映該用戶近期是否有在線行為。KK-DATA支援7天、15天、30天等窗口,導出值通常是一個整數(如7代表7天內活躍)。部分場景更喜歡區間標籤(7d_active),但標準做法是精確天數。
  • 性別(gender):基於頭像識別,不是100%準確,但可用於定向畫像。建議導出male / female / unknown,便於後續分析。

常見格式陷阱

注意:有些篩號平台將「有效」導出為「1/0」,而另一些為「true/false」。如果你的CRM只認「1/0」,就需要在導入前做文字替換。在導出前預覽檔案,確認欄位格式是關鍵。


如何規劃導出欄位以適配下游系統?

在創建篩號任務時,不要全選所有可用欄位,而是根據目標系統「精簡搭配」。以下常見場景的欄位推薦:

下游場景推薦導出欄位原因
Telegram群發(TG bot)phone, tgid, status, active_daystgid是發信所需,活躍度決定是否打擾
WhatsApp CRM導入phone, wsid, status, country_codewsid用於自動匹配WhatsApp聯絡人
數據分析/用戶畫像phone, gender, active_days, country_code, check_time需要多維標籤做交叉分析
批量行銷郵件(EDM)phone (作為唯一標識), status, gender僅需平台有效狀態和性別,減少欄位負擔

下游系統對欄位格式的常見要求

  • CRM(如HubSpot、Salesforce):大多使用CSV導入,欄位名需與CRM物件欄位名完全一致(區分大小寫),空值需用空字串或NULL表示。
  • 資料庫(MySQL/PostgreSQL):時間戳建議用YYYY-MM-DD HH:MM:SS格式,數值欄位不要帶千分位逗號,布林值用0/1。
  • 報表工具(Tableau、Power BI):喜歡寬表結構,每個維度一列,但避免大量重複空值。活躍度欄位建議保留原始整數,讓可視化工具自行分組。

避免欄位冗餘:如何只導出真正需要的列

核心理念:導出時用不到的資訊就是噪音。KK-DATA在創建任務時允許自定義導出列,你可以取消勾選不需要的欄位(如tgid、wsid甚至phone本身)。例如只做活躍度分析,可以勾選phone+active_days+country_code,其餘略過。這樣生成的檔案體積小、欄位少,導入任何系統都更清晰。

操作建議:

  1. 在控制台任務創建頁,進入「導出設置」選項卡。
  2. 按需勾選、排序欄位。
  3. 預覽前2行檔案,確認欄位順序和格式。
  4. 保存導出模板,下次重複使用。

導出後的數據清洗與欄位映射實操

拿到CSV檔案後,通常還需要兩到三步簡單處理才能直接導入下游系統。以下為標準操作流程:

步驟1:去除BOM與特殊字元
用Notepad++或VSCode將編碼轉為UTF-8 without BOM。某些CRM(如Zoho)會因BOM報錯。

步驟2:統一时间戳格式
如果下游要求ISO 8601(2024-01-15T10:30:00Z),而導出是2024-01-15 10:30:00,可用Excel或小腳本轉換。

步驟3:布林值轉換
valid/invalid1/0(用替換功能或公式=IF(A2="valid",1,0))。

步驟4:欄位名映射
將篩號平台的欄位名改為下游系統期望的名稱。例如,KK-DATA導出phone,CRM要求Phone,直接在CSV表頭修改。

步驟5:驗證數據完整性
檢查是否有空行、錯位、亂碼。尤其注意手機號是否帶+號,以及國家代碼是否一致。

最佳實踐

直接在KK-DATA控制台勾選欄位時,將欄位名改為與下游系統一致,是最高效的方法。但需注意,欄位名長度不要超過32字元(CRM常有限制)。


數據去重倉庫與欄位一致性:打通多任務導出的關鍵

多批次篩號時,同一個號碼可能出現在不同任務(例如先篩Telegram,後篩WhatsApp)。如果兩個導出的欄位格式不同(比如第一次用valid,第二次用active),合併後去重就變得複雜。

KK-DATA的數據去重倉庫,能保證同一號碼跨任務保持欄位標準一致。當你首次導出的欄位名和格式被存入倉庫後,後續所有包含該號碼的任務,均按首次的欄位結構輸出。這意味著你只需要在第一次任務中精心設計欄位模板,後面所有任務都能自動對齊。

去重倉庫欄位默認對齊建議

建議在首次任務時,使用與下游系統一致的欄位命名,包括大小寫。例如CRM中欄位為PhoneStatusGender,就在篩號任務導出設置中同樣命名。這樣無論多少次篩號,去重倉庫始終輸出統一格式,無需額外映射。


篩號源頭導出標準的最佳實踐檢查清單

按以下步驟執行,可確保每次導出的數據都能直接使用:

  • 明確下游系統支援的檔案格式:CSV還是TXT?分隔符是逗號、製表符還是豎線?
  • 確認是否需要tgid/wsid導出:如果只做號碼有效性統計,這兩個欄位可不勾選。
  • 比照下游系統欄位名:列欄位名是否完全一致(包括大小寫)?若不支援,導出後手動改表頭。
  • 預覽檔案:導出前用控制台的檔案預覽功能,檢查列順序與格式。
  • 激活數據去重倉庫:在KK-DATA個人設置中開啟去重,並確保第一次任務欄位對齊。
  • 首次測試:先用10條號碼測試導出,導入下游系統驗證是否報錯,確認無誤後再跑全量任務。
  • 保存導出模板:在控制台將常用組合保存為模板,後續任務一鍵應用,避免重複配置。

常見問題

問:篩號源頭導出標準是什麼意思?我為什麼要關注它?
答: 指從篩號平台(如KK-DATA)導出結果時,欄位名稱、數值格式與長度是否符合下游系統(如CRM欄位庫、API對接要求)的規範。關注它,能避免每次收到篩號結果都要手動映射、轉換,減少80%以上的清洗工作。

問:篩號源頭導出欄位可以自定義嗎?比如我只導出tgid和活躍度。
答: 可以。在KK-DATA控制台創建任務時,你可以在「導出欄位選項」中勾選需要的內容(包括tgid、wsid、性別、活躍度等),未勾選的欄位則不會出現在csv/txt檔案中,顯著減輕後續欄位映射負擔。

問:tgid與wsid導出後,能直接用於Telegram群發和WhatsApp行銷嗎?
答: tgid和wsid通常用於私信SDK或接口調用,而非直接作為「手機號」發送。你需要將導出的tgid/wsid導入到支援該ID的發送工具中(如TG機器人、WhatsApp Business API腳本)。篩號本身不負責發送操作。

問:007data和KK-DATA在導出欄位標準化方面有什麼差異?
答: 007data也提供類似的csv導出,但各家欄位命名可能不同(例如「性別」可能寫為「gender」 vs 「sex」)。KK-DATA在控制台內置了完善的欄位解釋說明、映射建議以及數據去重倉庫,能確保跨任務導出欄位一致,降低清洗成本。具體計費以官網為準。

問:我的CRM只接受「1/0」的用戶狀態值,但是篩號導出了「active/inactive」,怎麼辦?
答: 這是常見的不相容問題。建議在篩號任務導出頁使用欄位映射功能(如有)或在導出後用公式/腳本將文字轉換為整型;常規做法是修改csv表頭並添加轉換列。如果你能提前選擇布林值輸出格式(部分平台支援自定義),請預先設定為0/1。


本文撰寫時參考了KK-DATA官方文檔及控制台最新版本。如需查看實時單價與導出效果,請登錄應用控制台或聯繫客服 @kkdata_cc