昨天和一個(gè)代理商老板聊天
他說(shuō)
AI服務(wù)器可能是
2025年所有ICT產(chǎn)品里最好賣的單品
之前賣安全的、賣軟件的、賣網(wǎng)絡(luò)的..
現(xiàn)在都忍不住了悄悄地賣點(diǎn)AI服務(wù)器
![]()
這讓我恍然大悟了
怪不得最近看到的一些中標(biāo)項(xiàng)目
很多知名的老牌安全上市公司
都“堂而皇之”地參與,還中標(biāo)了
![]()
代理商老板繼續(xù)說(shuō)
他的團(tuán)隊(duì)現(xiàn)在遇到最大問(wèn)題是
傳統(tǒng)銷售,不懂如何賣AI服務(wù)器
一上來(lái),就給客戶甩一張清單
用賣傳統(tǒng)服務(wù)器的思路賣AI
最終又陷入拼價(jià)格的泥潭
![]()
很多傳統(tǒng)銷售都搞不清楚
客戶要拿AI服務(wù)器跑啥?
具體干啥活?要干到啥程度?
客戶一張口,銷售就接不住話
比如:我們要做多模態(tài)的「批量高吞吐」推理
![]()
另外,還有銷售給客戶說(shuō)傻話↓
這服務(wù)器貴!性能強(qiáng)!
這就是一句,不懂AI的外行話
殊不知,AI服務(wù)器不是越貴越好
而是越貼近任務(wù)越高效
比如,客戶要跑推理,跑AI應(yīng)用
你推薦給客戶買跑訓(xùn)練的高端機(jī)?
你當(dāng)客戶是冤大頭啊
![]()
往往是交流完,回到公司
直奔售前
![]()
所以
賣AI服務(wù)器本質(zhì)是啥?
你以為你賣的是「產(chǎn)品」
本質(zhì)你賣的是「AI算力解決方案」
對(duì)一線銷售的要求已經(jīng)上升到了另一個(gè)level
銷售必須具備一種核心能力
把客戶的業(yè)務(wù)語(yǔ)言,翻譯成算力需求語(yǔ)言
在整條AI服務(wù)器銷售路徑中
客戶溝通→需求識(shí)別→方案設(shè)計(jì)→成交策略
其中最關(guān)鍵的一步,就是——需求識(shí)別
![]()
那么
如何進(jìn)行有效客戶需求識(shí)別呢?
第一步:搞清客戶要干嘛
在拜訪客戶之前
心里得有個(gè)大致的數(shù)
采購(gòu)AI服務(wù)器的六大重點(diǎn)客戶群體
他們常見(jiàn)的訴求是啥
![]()
▍政府單位
一般都是私有化部署,買AI服務(wù)器很多是部署AI應(yīng)用,比如:AI政務(wù)辦公、智慧政務(wù)問(wèn)答(RAG+LLM)、智能客服(12345熱線)等,關(guān)心國(guó)產(chǎn)CPU/GPU兼容性,本地化交付,可上門優(yōu)化、服務(wù)等
▍科研院所、高校
一般是搞大模型訓(xùn)練和科學(xué)計(jì)算(AI for Science),他們往往有實(shí)力采購(gòu)高端訓(xùn)練服務(wù)器,但是也非常看重性價(jià)比,比較關(guān)注多租戶共享與資源調(diào)度,以及智算和超算融合。
▍傳統(tǒng)金融醫(yī)療能源等行業(yè)
實(shí)時(shí)推理和行業(yè)模型微調(diào)比較多,他們要求:高并發(fā)、低延遲推理,可靠性高,安全合規(guī)。
▍AI創(chuàng)業(yè)公司
這兩年蹦出來(lái)不少:大模型訓(xùn)練、續(xù)訓(xùn)、后訓(xùn)練、微調(diào)、API服務(wù)等。他們節(jié)奏快,看重性價(jià)比、交付周期、能靈活擴(kuò)容、要兼容多框架...
▍大型互聯(lián)網(wǎng)公司
AI服務(wù)器需求最猛、規(guī)模最大的客戶群,主要建AI集群,用于大模型訓(xùn)練、推理、多模型編排、智能體平臺(tái),要求高吞吐、高并發(fā)、低延遲,推理成本/百萬(wàn)token最低,長(zhǎng)期穩(wěn)定性,架構(gòu)靈活
......
第一次拜訪,見(jiàn)到客戶
最核心的問(wèn)題只有一個(gè)
用于什么場(chǎng)景?跑什么業(yè)務(wù)?
遇到不同客戶
他們回答肯定是五花八門的
甚至很多不是AI需求
比如:AI新應(yīng)用上線,數(shù)字人部署、公文自動(dòng)生成、合規(guī)審計(jì)、AIGC內(nèi)容生產(chǎn)、LLM微調(diào)、API推理、AI Agent平臺(tái)、油氣井智能監(jiān)測(cè)、基因測(cè)序、AI客服、汽車仿真碰撞、資料庫(kù)RAG...
![]()
客戶要跑啥業(yè)務(wù)
決定了你該賣哪種服務(wù)器
其實(shí)不管跑業(yè)務(wù)
最后都大致可以歸納成
5種常見(jiàn)AI計(jì)算任務(wù)
不同任務(wù)對(duì)服務(wù)器的配置要求完全不一樣
?
客戶搞大模型預(yù)訓(xùn)練、續(xù)訓(xùn)
這是從零造模型的階段,拼的是極限算力
動(dòng)不動(dòng)就要上萬(wàn)卡集群、十萬(wàn)卡集群
但是現(xiàn)實(shí)情況是
真正做預(yù)訓(xùn)練的客戶很少
多是DeepSeek、百度、阿里這類頭部公司
![]()
?
客戶搞全參微調(diào)
是在現(xiàn)有大模型基礎(chǔ)上再訓(xùn)練一次
讓模型更懂某個(gè)行業(yè)或任務(wù)
關(guān)鍵詞:大顯存+I/O快+高帶寬+高互聯(lián)
有些行業(yè)巨頭在練『行業(yè)大模型』
比如:石油大模型、金融大模型
本質(zhì)就是基于通用大模型,進(jìn)行全參微調(diào)
這種客戶,一般大模型廠商直接沖上去了
帶著算力、帶著定制服務(wù)
![]()
?
客戶搞輕量微調(diào)(LoRA、QLoRA)
在原模型上只調(diào)少量參數(shù)
屬于靈活小任務(wù)
關(guān)鍵詞:性價(jià)比+輕量+靈活
幾張中端GPU就能搞定,性價(jià)比優(yōu)先
適合中小項(xiàng)目、創(chuàng)業(yè)團(tuán)隊(duì)快速驗(yàn)證場(chǎng)景
![]()
?
客戶搞大模型推理
這是目前客戶需求最多的一類
就是模型已經(jīng)訓(xùn)練好要上崗干活
很多客戶為了部署AI應(yīng)用或智能體
要買個(gè)服務(wù)器/一體機(jī),基本都是推理
關(guān)鍵詞:快+穩(wěn)+能頂并發(fā)
推理拼的不是極限算力
而是吞吐量和響應(yīng)速度
![]()
?
客戶要搞RAG
這是【AI+搜索】的混合型工作
模型回答問(wèn)題前,要先去知識(shí)庫(kù)里查資料
再結(jié)合內(nèi)容生成結(jié)果
這類需求的上下文長(zhǎng)度通常更大
所以,對(duì)服務(wù)器的算力要求也會(huì)更高一些
不僅需要更強(qiáng)的GPU和更大的顯存
對(duì)內(nèi)存和CPU的要求也更高
(檢索模塊可能運(yùn)行在CPU/內(nèi)存上)
![]()
第二步:搞清客戶有多大盤子
盤子
也就是現(xiàn)在需求+預(yù)期規(guī)模
首先,問(wèn)清楚客戶現(xiàn)在采購(gòu)量級(jí)
單機(jī)試點(diǎn)、機(jī)柜部署、還是機(jī)房集群級(jí)?
![]()
其次,搞清楚后期規(guī)劃
比如,現(xiàn)在是第一期,后面還有二期
還是待定,先跑跑看
根據(jù)實(shí)際業(yè)務(wù)情況,再考慮擴(kuò)容
問(wèn)清楚這個(gè)并不功利,而是幫雙方避坑
遇到很多真實(shí)情況是
很多用戶一開(kāi)始是試水
1、2臺(tái)機(jī)器先試試
但半年后,模型參數(shù)翻幾倍
上下文從 8K 拉到 128K,并發(fā)多到炸
速度變慢,于是客戶開(kāi)始抱怨:
這機(jī)器怎么不行了?越跑越慢?
其實(shí)不是機(jī)器不行,是當(dāng)初沒(méi)留出余量

AI服務(wù)器選型不能只看今天
得往后推6–12個(gè)月,比較靠譜
AI日異月新,大概率會(huì)發(fā)生的事情是
模型會(huì)變大、上下文會(huì)變長(zhǎng)、流量會(huì)變多
當(dāng)然,也有客戶試完了,對(duì)大模型祛魅了
發(fā)現(xiàn)對(duì)業(yè)務(wù)幫助有限,沒(méi)下文了
![]()
第三步
盡可能帶上技術(shù)一起交流
引導(dǎo)出明確目標(biāo)
![]()
圍繞「跑啥」的核心問(wèn)題
順勢(shì)延展出其他問(wèn)題
一、模型類問(wèn)題
?模型規(guī)模:您要跑的模型有多大?(參數(shù)規(guī)模 / 模型尺寸)
?模型來(lái)源:這個(gè)模型是自研的,還是用第三方開(kāi)源模型(如 Qwen、ChatGLM、Llama、DeepSeek等)?
?數(shù)據(jù)量級(jí):訓(xùn)練/微調(diào)數(shù)據(jù)量大概多大?是否需要并行文件系統(tǒng)?
?微調(diào)策略:全參微調(diào)還是LoRA/QLoRA,SFT對(duì)齊還是偏好學(xué)習(xí)?
?模型生態(tài):是否已經(jīng)有既定的軟件棧或兼容要求?
?業(yè)務(wù)場(chǎng)景:對(duì)話聊天?代碼生成?文檔解析?公文寫作?事件調(diào)查?定制化開(kāi)發(fā)?還是API 調(diào)用 ?還是嵌入業(yè)務(wù)系統(tǒng)?
?未來(lái)方向:后續(xù)有沒(méi)有計(jì)劃升級(jí)模型尺寸或增加上下文長(zhǎng)度?
二、性能與并發(fā)問(wèn)題
就是,客戶希望達(dá)到什么效果
必須搞清楚客戶訴求的優(yōu)先級(jí)
是要算得多,還是要算得快,還是要穩(wěn)如狗?
目標(biāo)一不同,配置天差地別
![]()
下面問(wèn)題越具體
后面的方案越有針對(duì)性
?吞吐:每秒希望生成多少 token?或每秒處理多少請(qǐng)求(TPS)?單次請(qǐng)求上下文多長(zhǎng)?
?時(shí)延:響應(yīng)速度有什么要求?首字時(shí)間(TTFT)延遲要控制在多少?是要實(shí)時(shí)低延遲,還是批量高吞吐?
?并發(fā):系統(tǒng)同時(shí)要支撐多少人使用?(100?500?)預(yù)計(jì)同時(shí)會(huì)有多少活躍會(huì)話?
這個(gè)過(guò)程中,一定要注意客戶的
隨口一問(wèn)
![]()
這種看似不經(jīng)心的一問(wèn)
代表的是客戶的某種重要訴求
![]()
接下來(lái),方案環(huán)節(jié)
還要再疊加上自家的核心優(yōu)勢(shì)
比如:異構(gòu)算力(東西方都行)、更靈活的拓?fù)渑渲谩L(fēng)冷液冷全覆蓋、國(guó)產(chǎn)化、安全可控、交付快、支持強(qiáng)...
當(dāng)然,只買算力還不夠
大模型要落地,軟實(shí)力也很重要
比如MaaS平臺(tái)、應(yīng)用開(kāi)發(fā)工具鏈等等
這些軟能力,我們后續(xù)再講
![]()
第四步
招投標(biāo)了,看看別人標(biāo)底怎么玩的
在實(shí)戰(zhàn)中再學(xué)習(xí)
這是來(lái)自某個(gè)真實(shí)項(xiàng)目的標(biāo)書(shū)要求
某985名校預(yù)算2100萬(wàn)的AI服務(wù)器
具體參數(shù)我們先略過(guò)不看
就看看你能不能過(guò)得了這個(gè)演示關(guān)
![]()
這個(gè)標(biāo)底很不錯(cuò)啊
說(shuō)明客戶已經(jīng)不聽(tīng)純忽悠了
讓開(kāi)標(biāo)的時(shí)候直接上demo
沒(méi)點(diǎn)真水平,想搶單沒(méi)門了
![]()
最后就一句話
Q4了,祝大家開(kāi)單順利,大單連連
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.