近日,由釘釘團隊研發的深度研究系統「Dingtalk-DeepResearch」在國際權威評測中取得突破性成績,在 DeepResearch Bench 測試中以 48.49 分位列全球第二、國內第一,超越 OpenAI、Claude 等主流系統。

多場景落地,實現複雜任務智能處理

該系統已成功應用於製造業、供應鏈等複雜場景,能夠在複雜異構表格、多階段推理與多模態生成任務中保持行業領先的準確性和穩健性,幫助企業高效處理多模態數據,實現智能升級。

釘釘深度研究系統的這項進展,首次實現了國際頂級基準與實際生產落地的雙重突破,標誌著中國企業級 AI 技術邁入國際第一梯隊。

多智能體架構,支援深度協同研究

Dingtalk-DeepResearch 的核心是設計了一種面向真實企業場景的多智能體深度研究框架,將深度研究生成、異構表格解析與推理、多模態報告生成有效整合在同一系統中。

這一設計就像是將不同專業能力的團隊成員整合到一個系統中:有的擅長分析表格數據,有的負責生成報告,有的協調工具調用。通過三層架構設計(任務導向的智能體層、核心引擎層、數據層),能夠支援對複雜任務的並行處理與多階段推理,例如將包含多重嵌套與合併單元格的工廠生產表格,自動解析並轉化為結構清晰、洞察深刻的分析報告。

持續進化機制,實現自適應學習

為應對企業場景的動態變化,該框架通過熵引導、記憶感知的在線學習機制使智能體能夠持續演進,就像員工可透過反覆實踐提升技能,而無需人工干預。該機制保障系統能自動從歷史互動中歸納經驗,逐步適應不同企業的業務流程與用戶操作風格。

例如,當用戶多次修改 AI 輸出的報告格式後,系統會自主學習並記憶用戶對格式、風格及關鍵點的偏好,在後續生成中主動對齊用戶需求。在釘釘企業級 AI 平台中,這種經個性化調優的偏好可以作為一種能力沉澱並共享給團隊乃至整個公司,實現組織知識的複用與增效。

閉環評估體系,確保輸出質量可靠

為確保生成內容的準確性與可靠性,Dingtalk-DeepResearch 內建了 DingAutoEvaluator 評估系統。該系統會對生成的每一份報告進行多維度「質量檢驗」,涵蓋數據準確性、邏輯連貫性、工具使用規範等。一旦發現問題,系統會自動將相關案例反饋至訓練流程以優化模型,形成一套從生成、評估到優化的持續改進閉環。

已在多行業穩定應用,創造實際價值

目前,Dingtalk-DeepResearch 已在多個真實業務場景中穩定應用並創造價值。在供應鏈領域,系統能快速分析跨部門的複雜表格數據,為採購策略提供智能化建議;在製造業,它能將設備運行的原始數據自動轉化為可視化分析報告,為故障預測與維護提供決策支持。所有核心功能均通過國際基準測試驗證,確保了技術的可靠性與領先性。

釘釘 CTO 朱鴻表示,「Dingtalk-DeepResearch 通過結合自適應優化和多模態推理,形成一個可靈活部署的企业級 AI 框架,旨在處理複雜且不斷演進的真實業務任務。該技術正加速在 AI 搜索、AI 表格、自動化工作流、Agent 平台等產品中落實,讓前沿 AI 技術更貼近實際生產需求,為企業提供真正創造價值的 AI。」

多姆科技(DomTech)是釘釘在香港的官方指定服務商,專門為廣大客戶提供釘釘服務。如果您還想瞭解更多釘釘平臺應用的內容,可以直接諮詢我們的在線客服,或者通过电话+852 64392620或邮箱cs@dingtalk.com.hk联系我们。我們有優秀的開發和運維團隊,豐富的市場服務經驗,可以為您提供專業的釘釘解決方案和服務!