2023愛分析 · 數據科學與機器學習平臺廠商全景報告 | 愛分析報告

報告編委
黃勇
愛分析合伙人&首席分析師
孟晨靜
愛分析分析師
目錄
1. 研究范圍定義
2. 廠商全景地圖
3. 市場分析與廠商評估
4. 入選廠商列表
1. 研究范圍定義
研究范圍
經濟新常態下,如何對海量數據進行分析挖掘以支撐敏捷決策、適應市場的快速變化,正成為企業數字化轉型的關鍵。機器學習算法能識別數據模型,基于規律完成學習、推理和決策,正廣泛的應用在金融、消費品與零售、制造業、能源業、政府與公共服務等行業的各種業務場景中,如精準營銷、智能風控、產品研發、設備監管、智能排產、流程優化等。企業傳統的機器學習雖然能有效支撐業務決策,但由于嚴重依賴數據科學家,其技術門檻高、建模周期長的特點正成為企業實現數據驅動的阻礙。
數據科學與機器學習平臺是指覆蓋數據采集、數據探索、數據處理、特征工程、模型構建、模型訓練、模型部署與發布、模型管理與運營等建模全流程的平臺,提供一站式建模服務,能顯著提升建模效率、降低建模門檻。數據科學與機器學習平臺能支持并賦能企業各業務場景實現智能決策,幫助企業打造數據驅動型組織。
本報告對數據科學與機器學習平臺市場進行重點研究,面向金融、消費品與零售、制造與能源、政府與公共服務等行業企業,以及人工智能軟件與服務提供商的數據部門、業務部門負責人,通過對業務場景的需求定義和代表廠商的能力評估,為企業數據科學與機器學習平臺的建設規劃、廠商選型提供參考。
廠商入選標準
本次入選報告的廠商需同時符合以下條件:
廠商的產品服務滿足市場分析的廠商能力要求;
近一年廠商具備一定數量以上的付費客戶(參考第3章市場分析部分);
近一年廠商在特定市場的收入達到指標要求(參考第3章市場分析部分)。
2. 廠商全景地圖
愛分析基于對甲方企業和典型廠商的調研以及桌面研究,遴選出在數據科學與機器學習市場中具備成熟解決方案和落地能力的入選廠商。
3. 市場分析與廠商評估
愛分析對本次數據科學與機器學習平臺項目的市場分析如下。同時,針對參與此次報告的部分代表廠商,愛分析撰寫了廠商能力評估。
數據科學與機器學習平臺
市場定義:
數據科學與機器學習平臺是指覆蓋數據采集、數據探索、數據處理、特征工程、模型構建、模型訓練、模型部署與發布、模型管理與運營等建模全流程的平臺,提供一站式建模服務,能顯著提升建模效率、降低建模門檻。
甲方終端用戶:
金融、消費品與零售、制造與能源、政府與公共服務等行業企業,以及人工智能軟件與服務提供商的數據科學家、風控建模人員、營銷建模人員、業務分析人員、模型應用人員
甲方核心需求:
企業對機器學習的應用越來越廣泛。一方面,數據量的激增、算法的突破以及CPU、GPU、DPU等多種算力技術的發展,為以機器學習為基礎的數據挖掘、計算機視覺、自然語言處理、生物特征識別等技術在企業的應用奠定了技術基礎;另一方面,市場環境的快速變化對企業決策敏捷性要求增強,不僅推動企業將機器學習模型應用到營銷、廣告、風控、生產等更多業務場景,也對模型精度、模型開發敏捷性以及模型應用廣度提出更高要求。然而,機器學習技術門檻高、建模周期長,難以滿足企業通過基于機器學習模型提升經營效率的需求。
數據科學與機器學習平臺具備工具豐富集成、建模效率提升以及模型資產復用等特點,能充分滿足企業對智能應用的需求,正成為企業智能化基礎設施的必要構成。
不同企業對數據科學與機器學習平臺的需求不同,其差異取決于企業自身機器學習建模能力和對算法的需求。
1、對于金融、消費品與零售、制造與能源、政府與公共服務等行業企業
除大型金融機構外,傳統企業普遍不具備機器學習建模能力。大型金融機構數據科學團隊人才完善,對機器學習算法的探索和應用更前沿,如將機器學習模型應用在精準營銷、智能風控、產品研發、客戶體驗管理等多個場景中。但更多的傳統企業面臨IT人才缺失、尚未開始智能化應用或處于局部試驗的初期階段。傳統企業對數據科學與機器學習平臺的需求主要體現在以下四個方面:
1)降低機器學習建模門檻,使非專業建模人員也能掌握機器學習建模技術,賦能業務。傳統機器學習建模技術門檻高,需要組建專門的數據科學團隊,包括數據工程師、數據科學家、開發工程師等,人力成本高昂。傳統企業希望能降低機器學習建模門檻,如平臺能實現數據自動處理、自動特征工程、圖形化建?;蜃詣咏5裙δ埽狗菍I的業務人員也能快速開展建模工作,廣泛賦能業務,實現普惠AI。
2)提供定制化算法、模型部署和運營服務,快速創造業務價值。傳統行業多具備行業特性,行業垂直場景下的模型開發耗時耗力,而且傳統企業對AI智能應用的探索尚處于初期,更傾向“小步快跑”,因此購買定制化算法能節約人力、實現快速產出以及驗證AI智能應用效果。企業需要廠商提供定制化算法服務、模型在硬件平臺和操作系統平臺的部署服務以及模型運營服務。
3)縮短建模周期,提高業務敏捷響應度。以金融行業為例,金融企業的產品、服務、風控模型均需隨著客戶行為改變而持續迭代更新。但傳統的機器學習建模周期長達數月,無法敏捷響應業務需求。企業需要數據科學與機器學習平臺內置豐富的行業算法、模型模板、案例等,供建模人員直接調用,加速模型訓練;或是提供一鍵部署功能,實現模型在生產環境的快速部署。
4)提供咨詢服務,提升模型質量。對于具備一定機器學習建模能力的金融機構,需要廠商提供建模咨詢支持,協助企業完成數據準備、模型訓練、模型部署等環節,提升模型質量。
2、對于人工智能軟件與服務提供商
對于中小企業或是剛開始試點智能應用的企業,相較于數據科學與機器學習平臺需要的組織、人才、流程上的變革與支持,采購適用于特定場景的AI智能應用是性價比更高、更迅捷的解決方案。人工智能軟件與服務商如算法服務商、ISV即面向此類需求,提供模型和智能應用服務。以算法服務商為例,盡管具備專業的數據科學團隊,但中小型企業的算法需求多樣且個性化,如雖然都是AI視覺算法,智慧城市、智慧工業下的應用場景如安全帽識別、產品瑕疵識別的模型卻截然不同,需要基于業務數據集、業務思路分別進行訓練。這使得算法服務商常常面臨嚴格的算法交付周期和算法精度要求。具體而言,人工智能軟件與服務提供商對數據科學與機器學習平臺的核心需求主要體現在以下四個方面:
1)提高機器學習建模效率。軟件開發公司、算法提供商面臨嚴格的交付周期,但在傳統AI應用開發方式下,數據接入、數據處理、模型訓練等一系列建模流程都需要人工操作,建模周期長。其中數據接入環節因開源算法工具對不同類型的數據兼容性較差,需人工將原始數據轉化為開源算法所支持的數據類型;數據標注環節往往通過人工完成,并且部分領域的標注過程嚴重依賴專業知識,整體數據準備將耗費數周時間;模型部署中對模型的集成、監控和更新需要大量的調研和實施工作,單個模型部署到上線需要3-5個月。企業需要完善的數據科學工具和建模功能,支持實現數據采集、數據準備、特征工程、模型訓練、模型部署等建模全流程,提高建模效率。
2)滿足數據科學家復雜場景建模需求。平臺需支持數據科學家在復雜場景下進行靈活建模,如提供豐富的算法,預置主流機器學習框架,支持NoteBook建模方式,以及支持數據科學家在模型訓練中手動調參等。
3)對模型開發資源和計算資源進行統一管理,支持計算資源彈性擴容,加速建模計算性能。傳統開發模式中重復建設嚴重,如各項目數據準備、特征工程、模型訓練等各自研發,造成模型開發管理資源、計算資源浪費,難以適應大規模智能應用開發需求。另外,機器學習模型訓練過程中耗費大量計算資源,而一旦結束訓練,計算資源又處于閑置狀態。企業需要實現計算資源彈性擴容,滿足模型開發不同階段的計算需求。
4)為多角色的數據科學團隊提供協作平臺。機器學習建模過程需要數據工程師、數據科學家、數據分析師等多角色共同協作完成,存在反復溝通、協作流程不明確等問題,帶來重復性工作。
廠商能力要求:
為滿足金融、消費品與零售、制造與能源、政府與公共服務等行業企業,以及人工智能軟件與服務提供商等甲方客戶的核心需求,廠商需具備以下能力:
1、廠商應具備完善的機器學習模型開發功能,提供包括數據采集、數據準備、特征工程、模型訓練、模型部署等功能在內的一站式端到端數據科學與機器學習平臺。
1)數據采集方面,平臺應具備整合多源異構數據的能力,支持實時接入結構化數據和非結構化數據(如表格、圖片、時間序列數據、語音和文本等),并具備基本的ETL能力、數據實時更新和同步能力。
2)數據準備方面,平臺應提供豐富的數據清洗、數據探索工具。其中數據清洗環節,應能支持進行數據融合、數據缺失處理、數據分類、數據標注、數據異常處理、數據平滑以及整合非結構化數據和結構化數據等數據清洗工作,減少人工干預。數據探索環節,廠商需具備單變量和多變量統計、聚類分析、地理定位圖、相似度度量等分析能力。
3)模型訓練環節,針對非專業建模人員,平臺應提供簡便易用的建模工具,降低機器學習建模門檻。如平臺可通過建模全流程可視化降低用戶使用門檻,尤其在模型構建環節,應支持以拖拉拽的方式完成建模。針對專業建模人員,平臺應具備較高的靈活性和開放性,提供主流開源算法和建模工具。如為專業的數據科學家提供自由靈活的NoteBook建模方式,并預置主流機器學習框架R、TensorFlow、Pytorch、Spark等,以及豐富的機器學習算法。
4)模型部署環節,平臺應支持模型一鍵部署,使建模人員可快速將模型從開發環境部署到生產環境中,并提供API接口供業務人員調用。此外,平臺還應提供模型版本管理和模型監控功能,實時監測模型性能,保證模型質量。
5)資源管理方面,平臺需能對CPU、GPU資源進行管理和整合,以容器化方式對算力虛擬化,實現彈性擴容、性能加速等功能,且不同部門和項目之間可共享集群資源。
6)平臺應具備AutoML能力,包括提供數據自動清洗、智能標注、自動特征工程和自動模型訓練等功能,提高建模效率。其中特征工程環節,數據科學與機器學習平臺應能實現自動化特征構建、特征選擇、特征降維和特征編碼;模型訓練環節,平臺應支持自動化模型選擇、自動化調參、自動化超參數搜索、模型自動驗證等,減少模型訓練時間成本和人力成本。
7)此外,平臺還應支持多角色的數據科學團隊協作,協同數據工程師、數據科學家、業務人員等不同角色在建模工作流程中的模型注解、討論、答疑、評論等,使建模過程可追溯、模型可復用,減少重復性工作。
2、廠商需具備垂直行業Know-how能力,為企業提供咨詢和實施部署服務。廠商的專業服務能力體現在三個方面:一方面,基于豐富的垂直行業知識和經驗積累,廠商能為用戶提供行業場景相關的算法、模型模板,或是將行業經驗與模型算法相結合,形成諸如精準營銷、智能推薦、反欺詐、設備預警等智能業務模型,供用戶直接調用;另一方面,廠商能提供建模咨詢服務,通過數據科學專家團隊規劃有效的模型應用到特定業務的運營方案,協助用戶完成數據準備、模型訓練、模型部署、模型運營等工作,以及將企業既有的數據集經驗、特征工程經驗、模型經驗等提煉形成數字資產,內嵌到平臺中。此外,廠商應具備較強的實施部署能力,包括提供定制化模型算法在硬件平臺和操作系統平臺的部署服務、以及數據科學與機器學習平臺的部署服務。
入選標準:
1.符合市場定義中的廠商能力要求;
2.2021Q3至2022Q2該市場付費客戶數量≥10個;
3.2021Q3至2022Q2該市場合同收入≥1000萬元;
代表廠商評估:
百分點科技
廠商介紹:
北京百分點科技集團股份有限公司(簡稱“百分點科技”)成立于2009年,是領先的數據科學基礎平臺及數據智能應用提供商,圍繞智慧政務、公共安全、數字產業三大業務板塊,為國內外企業和政府客戶提供端到端數智化解決方案。
產品服務介紹:
百分點數據科學基礎平臺圍繞數據價值增值過程,提供數據融合治理、數據建模與知識生產、知識應用三大工具集,覆蓋從數據集成、數據治理、數據建模、數據分析到數據服務的完整數據價值鏈條。其中數據建模環節,內置機器學習平臺,能一站式、可視化地實現數據準備、特征工程、模型開發與訓練、模型部署與發布、模型管理等機器學習建模全流程,幫助企業快速構建數據分析、語義分析、語音分析以及視覺分析應用。
廠商評估: 百分點機器學習平臺能實現一站式、可視化機器學習建模全流程管理,具備高效的數據預處理、豐富的模型服務能力。此外,百分點科技具備完善的數據建模上下游數據科學工具,能幫助用戶實現“數據——知識——應用”閉環,并在智慧公安、應急管理、客戶體驗管理等領域沉淀豐富行業經驗,能為用戶提供端到端解決方案。
具備便捷、高效的數據預處理能力。百分點機器學習平臺封裝了大量預處理算法組件支持對數據的提取、清洗、轉化、組合、去重等多種處理操作,尤其分布式數據處理組件,可大幅提升數據預處理速度。此外,百分點機器學習平臺還提供文本標注、語音標注、圖像標注、視頻標注四種標注類型,支持多模態信息抽取和融合。
建模全流程可視化,顯著降低用戶使用門檻。百分點機器學習平臺提供從數據接入、數據預處理、特征工程、模型訓練、模型評估、模型管理及發布的全流程可視化操作。其中在建模環節,機器學習平臺封裝大量機器學習算法組件并支持可視化參數配置,用戶可零代碼操作,通過簡單拖拽和連線對算法組件進行組合,進而構建復雜的機器學習框架,以及通過調節、配置參數完成模型創建。在模型訓練及評估環節,平臺支持模型評估指標以圖、表的形式展現,用戶可動態查看評估指標,實時掌控模型優度情況。在模型發布后,支持對發布上線的任務進行可視化實時監控,幫助建模人員輕松完成智能監控、定時任務調度。
提供豐富的模型服務,簡化模型工程化事項。在模型發布方面,提供一鍵部署功能,自動分配集群資源,實現大數據環境下機器學習模型的穩定運行。模型管理方面,支持模型詳細信息查看、多版本對比以及模型復用。此外,百分點科技還提供模型的下發、上報、訂閱及評論功能,支持模型的共享和評價,如在全國公安機關警務督察信息研判系統案例中,系統可以將模型下發到省級、市級警務督察部門,并且支持基層干警對模型進行修正或評價,以實現模型快速分享和反饋。
具備完善的數據建模上下游數據科學工具,為用戶實現“數據——知識——應用”閉環。百分點數據科學基礎平臺中,數據建模的上游工具包括數據集成、數據治理、數據開發等多種數據融合治理工具,能提高用戶數據治理能力、沉淀數據資產。下游工具包括知識生產工具,如指標體系、標簽體系、知識圖譜構建,基于數據建模幫助企業實現知識生產;以及知識應用工具,如商業智能分析、知識融合分析、領域知識管理等,將知識進一步應用到業務場景中,提升企業經營效率。
在智慧公安、應急管理、客戶體驗管理領域提供端到端解決方案,賦能業務場景應用。百分點科技成立于2009年,在智慧公安、應急管理、客戶體驗管理等領域沉淀了大量領域know-how和項目經驗,能為政府單位用戶以及工業、零售快消等行業企業用戶提供端到端的解決方案,包括項目咨詢、項目開發、項目運營、項目服務等。在服務用戶的過程中,百分點科技項目團隊包含數據科學家、數據工程師、業務專家等,協同用戶一起將數據、模型和工具融入智慧統計、數字營商、經營分析、營銷洞察等業務場景中,真正實現業務價值。此外,百分點科技也將行業經驗與模型算法相結合,形成銷量預測、庫存預警、指揮調度、監測預警、風險預測等豐富的智能業務模型,供用戶直接調用。
典型客戶:
中旅中免、應急管理部、北京市公安局、北京市統計局
入選廠商列表
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
標簽:
您可能也感興趣:
為您推薦
放得下接得住管得好 寧夏林草局全面實現全程網辦
上海市林業總站開展濕地健康水生態調研并召開討論會
相約在廣東飛羽悅瞬間 2022廣東候鳥護飛行動正式啟動
排行
精彩推送
- 2023愛分析 · 數據科學與機器學習平臺廠商全景報告 | 愛分析報告
- Evusheld恩適得香港開打 全球唯一預防新冠病毒藥物上市
- 2023年中央一號文件發布,“任務清單”如何抓落實
- 2022年全國消協組織共為消費者挽回經濟損失137767萬元
- 全價值鏈賦能,數字化助力營銷價值全力釋放 | 愛分析報告
- 2022愛分析 · DataOps廠商全景報告 | 愛分析報告
- 環球訊息:2022年全國消協組織共為消費者挽回經濟損失137767萬元
- 2022年全國消協組織為消費者挽回經濟損失137767萬元
- 全球今亮點!2022年全國消協組織為消費者挽回經濟損失137767萬元
- 【快播報】國家發改委:制定出臺革命老區振興發展2023年工作要點
- 當前熱訊:國家發改委:制定出臺革命老區振興發展2023年工作要點
- 當前焦點!多地民政部門公布婚姻登記大數據,初婚平均年齡超27歲
- 全球焦點!多地民政部門公布婚姻登記大數據,初婚平均年齡超27歲
- 6G時代加速到來!利用柔順機構的可重構天線問世!
- 速訊:人民銀行超量續作4990億元MLF 利率保持不變
- 人民銀行超量續作4990億元MLF 利率保持不變
- 全球熱門:國家發改委:推進廢舊設備回收利用 引導加大金融支...
- 今日熱門!國家發改委:推進廢舊設備回收利用 引導加大金融支...
- 拓寬融資渠道 力挺民企上市
- 焦點關注:四部門印發指導意見,提出用十至十五年 全國適宜...
- 2021年以來全國新發展新就業形態勞動者會員1037萬人
- 多管齊下引導居民從超額儲蓄向消費轉化
- 拓寬融資渠道 力挺民企上市
- 世界微頭條丨加快消費場景創新
- 今熱點:加快消費場景創新
- 天天視點!我國市場主體數量增至1.7億戶
- 天天熱推薦:四部門印發指導意見,提出用十至十五年 全國適...
- 全國市場主體達1.7億戶
- 全球快資訊丨各地政府助企服務落在實處 精準護航中小企業可...
- 【環球報資訊】國資委:相關央企要制定提質增效硬招實招
- 焦點熱門:國資委:相關央企要制定提質增效硬招實招
- 愿得一心人,情人節來寧波阪急“Tu”露真心
- 天天熱資訊!《靈活就業群體調查暨2022年四季度靈活就業景氣...
- 前瞻IPO頭條:3過3!安徽芯科上會成功!IBM宣布完成對StepZen...
- 天天觀速訊丨預告:最高檢就“做優新時代刑事檢察”舉行新聞...
- 《靈活就業群體調查暨2022年四季度靈活就業景氣指數報告》發布
- 當前聚焦:國家鄉村振興局:聚焦產業就業,增強脫貧地區和脫...
- 預告:最高檢就“做優新時代刑事檢察”舉行新聞發布會
- 每日精選:國資委赴部分中央企業開展穩增長工作調研
- 熱議:國家鄉村振興局:聚焦產業就業,增強脫貧地區和脫貧群...
- 觀熱點:樹木真的可以在地下交流嗎?可能并非如此
- 1月份新增信貸4.9萬億元 實現“開門紅”
- 環球信息:1月份新增信貸4.9萬億元 實現“開門紅”
- 焦點快播:違規轉貸嚴重者將承擔刑事責任!官方緊急提醒!提...
- 【時快訊】2023年要以穩物價為重點
- 2023年要以穩物價為重點
- 環球關注:農業農村部:深化農村集體經營性建設用地入市試點...
- 世界視點!重磅!新方法有望治愈Ⅰ型糖尿病!
- 【快播報】發改委:引導金融機構加大對廢舊設備資源循環利用...
- 播報:發改委強化重大項目廢舊設備回收利用管理:可納入中央...
- 【環球新要聞】發改委:引導金融機構加大對廢舊設備資源循環...
- 發改委強化重大項目廢舊設備回收利用管理:可納入中央預算,...
- 【獨家焦點】逐浪萬億藍海,搶抓時代機遇,中國餐飲的超級市...
- 【天天新要聞】1月信貸“狂飆”
- 天天百事通!提升企業市場融資意愿
- 前沿資訊!1月信貸“狂飆”
- 焦點要聞:提升企業市場融資意愿
- 百事通!擴大新基建投資 賦能打造發展新優勢
- 【新視野】聚焦基礎設施等重點領域 國家開發銀行1月發放中長...
- 天天實時:國家開發銀行1月發放中長期貸款超過2100億元
- 國家開發銀行1月發放中長期貸款超2100億元
- 天天滾動:國家開發銀行1月發放中長期貸款超過2100億元
- 環球新動態:國家開發銀行1月發放中長期貸款超2100億元
- 全球訊息:2023年中央一號文件:九方面重點工作全面推進鄉村振興
- 環球精選!小規模納稅人1月發生適用3%征收率的銷售額15萬元,...
- 全球今日報丨1月份信貸“狂飆”成經濟復蘇前奏
- 【世界報資訊】1月份信貸“狂飆”成經濟復蘇前奏
- 加快政策落實 增強群眾獲得感 優化營商環境下好“先手棋”
- 世界信息:去年前11個月檢察機關起訴行賄犯罪1208件1704人
- 兩融業務啟動 北證50大漲 2次新股漲逾10%!業內人士:意義重大
- 焦點快報!強化執法震懾 “零容忍”靶向發力
- 全球要聞:全面注冊制壓實中介機構“看門人”責任更精準
- 天天實時:資產處置成扭虧重要法寶 230家公司預計去年業績扭虧
- 世界快報:強化執法震懾 “零容忍”靶向發力
- 消息!補充銀行中長端流動性 2月MLF有望超額續做
- 15家公司2022年業績預喜 瞄準預制菜業務 多家公司加碼布局
- 兩融開閘首日 北交所市場成交額增逾六成
- 世界觀察:補充銀行中長端流動性 2月MLF有望超額續做
- 世界觀天下!資產處置成扭虧重要法寶 230家公司預計去年業績扭虧
- 當前熱點-全面注冊制壓實中介機構“看門人”責任更精準
- 每日速訊:貸款“造地”一舉多得 長效“管護”尚待加強
- 世界快資訊丨最高檢:2022年前11月檢察機關起訴涉嫌職務犯罪...
- 天天觀焦點:中央一號文件持續關注的六個領域 今年有哪些變...
- 多地支持與規范措施并舉 激發平臺發展潛力助經濟提質換擋
- 天天快訊:最高檢:2022年前11月檢察機關起訴涉嫌職務犯罪司法...
- 多地支持與規范措施并舉 激發平臺發展潛力助經濟提質換擋
- 全球通訊!穩住項目建設“主戰場”,夯實經濟運行“壓艙石”
- 【天天新要聞】21.5萬億元!“狂飆”的重大項目投資如何“四...
- 全球熱頭條丨21.5萬億元!“狂飆”的重大項目投資如何“四兩...
- 商務部明確2023年外資工作新形勢新要求 部署全年外資重點工作
- 快報:商務部明確2023年外資工作新形勢新要求 部署全年外資...
- 稅務部門優化稅收營商環境 服務地方經濟發展
- 如何搶跑數字醫療賽道?2023全球數字醫療創新生態峰會(中國...
- 世界球精選!稅務部門優化稅收營商環境 服務地方經濟發展
- 每日時訊!工信部中小企業局赴多地開展中小企業服務體系工作情...
- 全球快訊:工信部中小企業局赴多地開展中小企業服務體系工作情...
- 全球簡訊:季度監測:金融服務鄉村振興力度加大,涉農貸款余額...
- 每日看點!季度監測:金融服務鄉村振興力度加大,涉農貸款余額...
- 【聚看點】1月信貸迎“開門紅”,釋放經濟加快復蘇信號
- 每日快訊!1月信貸迎“開門紅”,釋放經濟加快復蘇信號