关于作者
KK-DATA 获客数据筛号平台官方内容团队。
篩號源頭導出標準:CSV與通用欄位規範,實現下游系統無縫對接
出海行銷團隊每天要處理成千上萬條號碼,篩號平台批量驗證有效、活躍、性別,結果導出一堆CSV或TXT檔案。但問題來了:導出後直接扔進CRM,欄位對不上;導入數據分析工具,格式不相容;發給業務同事,對方追問「這個tgid是什麼?」 其中的核心痛點,就是篩號源頭導出缺乏欄位規範。本文用KK-DATA為例,詳解面向CRM、EDM、私信工具的數據導出標準,涵蓋csv、tgid、wsid欄位映射,幫你一次導出就用得上,不再反覆清洗。
為什麼篩號源頭導出欄位標準化如此重要?
下游系統(CRM、Marketing Automation、數據中台、Telegram群發插件)對數據格式有嚴格的要求。欄位名大小寫、分隔符、布林值表示法稍有偏差,就需要手動或寫腳本轉換。一個10萬條的篩號結果,清洗工作往往需要2-3小時,部分團隊甚至因此放棄使用更細緻的性別/活躍度標籤,只保留最簡單的「有效/無效」,浪費了篩號平台的深度能力。
標準化導出帶來三個直接好處:
- 自動映射:CRM導入時,欄位名和數據格式直接匹配,無需中間表。
- 減少人工:清洗時間從小時級降到分鐘級(只需檢查檔案編碼和分隔符)。
- 提高ROI:篩號花的每一分錢,都轉化為可直接使用的結構化數據。
篩號源頭常見的導出欄位一覽(csv、txt)
無論用哪個篩號平台,導出檔案都包含一組核心欄位。下面是基於KK-DATA和行業通用實踐的欄位清單,以及它們的業務含義和格式範例。
| 欄位名(英文常用) | 業務含義 | 格式範例 | 常見問題 |
|---|---|---|---|
| phone / phone_number | 完整國際號碼(帶+號) | +8613800138000 | 有些平台去掉+,下游CRM可能需要補全 |
| country_code | 國際區號(數字,不含+) | 86 | 用於分國家統計 |
| iso_country | ISO二位國家代碼 | CN | 區分數據源的國籍標籤 |
| tgid | Telegram內部唯一ID(數字) | 1234567890 | 用於TG私信SDK調用,不是手機號 |
| wsid | WhatsApp內部ID | [email protected] | 用於WhatsApp Business API |
| status | 號碼狀態(有效/無效/未知) | valid / invalid / unknown | 部分平台輸出 1/0 |
| active_days | 最近活躍天數(Telegram) | 15 | 精確整數或區間(如15-30) |
| gender | 基於頭像的性別識別(Telegram) | male / female / unknown | 不同平台可能用M/F/U |
| check_time | 檢測時間戳(UTC+8) | 2024-01-15 10:30:00 | 注意時區對齊 |
| platform | 檢測平台 | telegram / whatsapp / imessage | 多平台任務時區分 |
平台專用欄位:tgid、wsid的定位與導出意義
- tgid:Telegram用戶唯一數字ID。它不等於手機號,但可用於Telegram群發機器人的sendMessage接口。導出tgid後,配合API可直接向用戶發私信,無需存手機號。
- wsid:WhatsApp內部ID,格式通常為
[email protected]。這是WhatsApp Business API要求的標準標識,用於發送訊息或查詢狀態。篩號時檢測到號碼有效,同時導出wsid即可直接對接發送系統。 - 這兩個欄位不是所有場景都需要。如果僅做號碼有效性驗證,不涉及後續主動推送,可以不導出。
號碼狀態欄位:有效、活躍、性別識別的導出標籤規範
- 有效(Status):至少代表該號碼已註冊對應平台。建議使用
valid / invalid,不推薦用yes/no,因為下游系統常對布林值有歧義。 - 活躍(active_days):反映該用戶近期是否有在線行為。KK-DATA支援7天、15天、30天等窗口,導出值通常是一個整數(如
7代表7天內活躍)。部分場景更喜歡區間標籤(7d_active),但標準做法是精確天數。 - 性別(gender):基於頭像識別,不是100%準確,但可用於定向畫像。建議導出
male / female / unknown,便於後續分析。
常見格式陷阱
注意:有些篩號平台將「有效」導出為「1/0」,而另一些為「true/false」。如果你的CRM只認「1/0」,就需要在導入前做文字替換。在導出前預覽檔案,確認欄位格式是關鍵。
如何規劃導出欄位以適配下游系統?
在創建篩號任務時,不要全選所有可用欄位,而是根據目標系統「精簡搭配」。以下常見場景的欄位推薦:
| 下游場景 | 推薦導出欄位 | 原因 |
|---|---|---|
| Telegram群發(TG bot) | phone, tgid, status, active_days | tgid是發信所需,活躍度決定是否打擾 |
| WhatsApp CRM導入 | phone, wsid, status, country_code | wsid用於自動匹配WhatsApp聯絡人 |
| 數據分析/用戶畫像 | phone, gender, active_days, country_code, check_time | 需要多維標籤做交叉分析 |
| 批量行銷郵件(EDM) | phone (作為唯一標識), status, gender | 僅需平台有效狀態和性別,減少欄位負擔 |
下游系統對欄位格式的常見要求
- CRM(如HubSpot、Salesforce):大多使用CSV導入,欄位名需與CRM物件欄位名完全一致(區分大小寫),空值需用空字串或NULL表示。
- 資料庫(MySQL/PostgreSQL):時間戳建議用
YYYY-MM-DD HH:MM:SS格式,數值欄位不要帶千分位逗號,布林值用0/1。 - 報表工具(Tableau、Power BI):喜歡寬表結構,每個維度一列,但避免大量重複空值。活躍度欄位建議保留原始整數,讓可視化工具自行分組。
避免欄位冗餘:如何只導出真正需要的列
核心理念:導出時用不到的資訊就是噪音。KK-DATA在創建任務時允許自定義導出列,你可以取消勾選不需要的欄位(如tgid、wsid甚至phone本身)。例如只做活躍度分析,可以勾選phone+active_days+country_code,其餘略過。這樣生成的檔案體積小、欄位少,導入任何系統都更清晰。
操作建議:
- 在控制台任務創建頁,進入「導出設置」選項卡。
- 按需勾選、排序欄位。
- 預覽前2行檔案,確認欄位順序和格式。
- 保存導出模板,下次重複使用。
導出後的數據清洗與欄位映射實操
拿到CSV檔案後,通常還需要兩到三步簡單處理才能直接導入下游系統。以下為標準操作流程:
步驟1:去除BOM與特殊字元
用Notepad++或VSCode將編碼轉為UTF-8 without BOM。某些CRM(如Zoho)會因BOM報錯。
步驟2:統一时间戳格式
如果下游要求ISO 8601(2024-01-15T10:30:00Z),而導出是2024-01-15 10:30:00,可用Excel或小腳本轉換。
步驟3:布林值轉換
valid/invalid → 1/0(用替換功能或公式=IF(A2="valid",1,0))。
步驟4:欄位名映射
將篩號平台的欄位名改為下游系統期望的名稱。例如,KK-DATA導出phone,CRM要求Phone,直接在CSV表頭修改。
步驟5:驗證數據完整性
檢查是否有空行、錯位、亂碼。尤其注意手機號是否帶+號,以及國家代碼是否一致。
最佳實踐
直接在KK-DATA控制台勾選欄位時,將欄位名改為與下游系統一致,是最高效的方法。但需注意,欄位名長度不要超過32字元(CRM常有限制)。
數據去重倉庫與欄位一致性:打通多任務導出的關鍵
多批次篩號時,同一個號碼可能出現在不同任務(例如先篩Telegram,後篩WhatsApp)。如果兩個導出的欄位格式不同(比如第一次用valid,第二次用active),合併後去重就變得複雜。
KK-DATA的數據去重倉庫,能保證同一號碼跨任務保持欄位標準一致。當你首次導出的欄位名和格式被存入倉庫後,後續所有包含該號碼的任務,均按首次的欄位結構輸出。這意味著你只需要在第一次任務中精心設計欄位模板,後面所有任務都能自動對齊。
去重倉庫欄位默認對齊建議
建議在首次任務時,使用與下游系統一致的欄位命名,包括大小寫。例如CRM中欄位為Phone、Status、Gender,就在篩號任務導出設置中同樣命名。這樣無論多少次篩號,去重倉庫始終輸出統一格式,無需額外映射。
篩號源頭導出標準的最佳實踐檢查清單
按以下步驟執行,可確保每次導出的數據都能直接使用:
- 明確下游系統支援的檔案格式:CSV還是TXT?分隔符是逗號、製表符還是豎線?
- 確認是否需要tgid/wsid導出:如果只做號碼有效性統計,這兩個欄位可不勾選。
- 比照下游系統欄位名:列欄位名是否完全一致(包括大小寫)?若不支援,導出後手動改表頭。
- 預覽檔案:導出前用控制台的檔案預覽功能,檢查列順序與格式。
- 激活數據去重倉庫:在KK-DATA個人設置中開啟去重,並確保第一次任務欄位對齊。
- 首次測試:先用10條號碼測試導出,導入下游系統驗證是否報錯,確認無誤後再跑全量任務。
- 保存導出模板:在控制台將常用組合保存為模板,後續任務一鍵應用,避免重複配置。
常見問題
問:篩號源頭導出標準是什麼意思?我為什麼要關注它?
答: 指從篩號平台(如KK-DATA)導出結果時,欄位名稱、數值格式與長度是否符合下游系統(如CRM欄位庫、API對接要求)的規範。關注它,能避免每次收到篩號結果都要手動映射、轉換,減少80%以上的清洗工作。
問:篩號源頭導出欄位可以自定義嗎?比如我只導出tgid和活躍度。
答: 可以。在KK-DATA控制台創建任務時,你可以在「導出欄位選項」中勾選需要的內容(包括tgid、wsid、性別、活躍度等),未勾選的欄位則不會出現在csv/txt檔案中,顯著減輕後續欄位映射負擔。
問:tgid與wsid導出後,能直接用於Telegram群發和WhatsApp行銷嗎?
答: tgid和wsid通常用於私信SDK或接口調用,而非直接作為「手機號」發送。你需要將導出的tgid/wsid導入到支援該ID的發送工具中(如TG機器人、WhatsApp Business API腳本)。篩號本身不負責發送操作。
問:007data和KK-DATA在導出欄位標準化方面有什麼差異?
答: 007data也提供類似的csv導出,但各家欄位命名可能不同(例如「性別」可能寫為「gender」 vs 「sex」)。KK-DATA在控制台內置了完善的欄位解釋說明、映射建議以及數據去重倉庫,能確保跨任務導出欄位一致,降低清洗成本。具體計費以官網為準。
問:我的CRM只接受「1/0」的用戶狀態值,但是篩號導出了「active/inactive」,怎麼辦?
答: 這是常見的不相容問題。建議在篩號任務導出頁使用欄位映射功能(如有)或在導出後用公式/腳本將文字轉換為整型;常規做法是修改csv表頭並添加轉換列。如果你能提前選擇布林值輸出格式(部分平台支援自定義),請預先設定為0/1。
本文撰寫時參考了KK-DATA官方文檔及控制台最新版本。如需查看實時單價與導出效果,請登錄應用控制台或聯繫客服 @kkdata_cc。
Related Articles
篩號源頭 10 問 10 答:Telegram/WhatsApp 篩號常見問題終極指南(2025)
從號碼生成到活躍檢測,一文講透篩號源頭。覆蓋Telegram/WhatsApp篩號原理、計費模式、平台對比、數據安全等10個核心FAQ。含007data、thdata、KK-DATA等工具客觀對比,助你選擇最高效的獲客篩號方案。
全球號碼生成源頭:從零構建出海獲客的篩號流水線
掌握全球號碼生成源頭,輕鬆搭建Telegram、WhatsApp篩號流水線。KK-DATA提供240+國家號碼生成服務(免費),與跨平台篩號無縫銜接,助你高效驗證號碼有效性與活躍度。本文詳解號段策略、生成→篩選→導出路徑及避坑指南,適合出海行銷與社群運營團隊。
篩號源頭去重攻略:跨任務去重倉庫如何為出海獲客節省 30% 成本
篩號源頭去重是批量號碼驗證的關鍵環節。本文解析KK-DATA去重倉庫如何實現跨任務去重,避免重複檢測浪費餘額,為出海團隊節省真實成本。適合Telegram、WhatsApp篩號場景,附常見問題與最佳實踐。