企查查全球首發商查大模型“知彼阿爾法”,助力構建安全可信人工智能
近年來,企查球首全人工智能成為全球數字技術創新最活躍的查全查前沿領域之一,是發商法助數字經濟的新賽道和國際競爭的新熱點。同時,模型社會公眾對于人工智能疑慮未消,知彼在踩下油門的力構同時如何控制好速度與方向,從而構建安全、建安可信的信人人工智能產業生態,探索基于可信數據的工智AIGC(生成式人工智能),成為人工智能未來突破的企查球首全一個重要方向。
7月3日,查全查企查查發布全球首款商查大模型——企查查“知彼阿爾法”。發商法助這款大模型是模型基于企查查在商業查詢領域近十年可信數據積累后進行大規模預訓練的成果,后續將上線的知彼創新產品通過大模型+企業信用數據庫共同構建,用AI技術賦能企信大數據創新,力構打造安全、可信的人工智能產品,為用戶提供更加便捷、精準的商業信息查詢服務。

圖:企查查商查大模型“知彼阿爾法”
業內首款商查大模型為何會是企查查?
企查查創始人陳德強表示,企查查擁有覆蓋全球近5億家企業的企信數據庫。商業信息查詢服務最核心的資源就是相關的數據資源,比如工商信息、訴訟信息等。并且,數據覆蓋面要足夠廣泛,不僅要有中國的全量數據,還要有全球其他國家的數據。此外,在企業標訊、企業盡調等專業性很強的領域,還需要建立專門的數據庫。要將AIGC技術引入商業信息查詢服務領域,最關鍵的動作就是用企信數據集來訓練相關模型。數據量越大、數據質量越高,最終訓練出來的模型才越精準。相對于當前其他大語言模型主要用公開的互聯網數據集,工商、司法等專業數據的獲取難度更大??梢哉f,企查查所覆蓋的5億家企業征信數據資源是企查查商查服務最核心壁壘,匯集了目前國內市場中的80個產業鏈,8000個行業,及海量的市場實時工商信息、風險公示、知識產權、征信報告、股權關系等300+維度的企信數據。這些數據,不僅為企查查構建了較高的競爭壁壘,也為其訓練知彼阿爾法商查大模型,奠定了堅實的數據基礎。
據了解,企查查的AI算法模型國內領先,在今年5月獲得”中國智能科學技術最高獎”吳文俊人工智能科學技術獎。在算法層面,企查查有著深厚的AI技術積累,多年來,企查查通過運用深度學習、自然語言處理(NLP)等AI技術,現已實現在海量全球多語言文本中進行自動化、智能化的數據分析與文本挖掘,并能進一步實現深層次語義分析,為用戶提供更精準的語義檢索服務。在預訓練模型領域籍由豐富的數據資源,企查查已經有較強的技術積累,本次企查查發布的知彼阿爾法商查大模型實現了完全自主知識產權。
豐富多樣的產品服務與應用場景。用戶直接面對的是產品,而不是技術。因此,要想將AIGC底層的大模型技術應用于商查服務,就必須要將技術封裝成便于用戶使用的產品。而且,針對不同的用戶需求,要構建針對性的產品,進而形成相對完備的產品矩陣。以產品矩陣的方式,來為商查用戶提供一站式服務。在產品層面,企查查針對不同用戶群體,構建了完善的產品矩陣,具體來看:對于企業用戶而言,企查查通過定制化服務提供精準拓客、企業評級、盡職調查、風險控制、司法調查、輿情監控、供應鏈管理等場景的解決方案,輔助企業用戶完善企業畫像、信息交叉核驗、尋找合作伙伴;對于個人用戶而言,企查查通過云平臺綜合多維度數據提供投融資、求職招聘、風險判定等場景的解決方案,為個人用戶透視企業股權架構,規避企業識別過程中的信用風險;對于公共部門用戶而言,企查查數據既是央行官方征信渠道的重要補充,也是地方政府政策制定、社會信用體系建設、招商引資、篩選政策扶持對象、進行企業信用監管重要參考。
為什么要打造商查版ChatGPT?
伴隨著數據量的積累以及產品功能的增加,商查領域出現諸多問題和需求痛點,主要表現在兩個方面:
用戶還停留在關鍵詞搜索階段,平臺還不能很好理解用戶復雜的業務需求。目前大部分商查平臺本質上就是企業信用信息領域的搜索引擎,用戶通過關鍵詞,在企信數據庫里搜索對應的企業或者風險信息,很難表述出用戶復雜、結構化的需求。比如:某學校食堂招標過程中希望了解供應商的食品安全風險,用此前的商查產品一般是先輸入參與投標的公司名稱,然后跳轉到到對應公司的主頁面,再通過查找該公司“經營風險”中行政處罰或“經營信息”中的“食品安全”內容,才能確定該公司是否存在食品安全風險,步驟繁多,且對新用戶并不友好。如果用戶還想知道該企業法人經營的其他餐飲公司是否有過重大安全事件?本次投標是否有關聯企業陪標?類似這些更深入的需求,簡單的檢索信息就很難快速滿足用戶。即使能實現需求,也需要用戶本身具備相關的專業知識,并能熟練掌握商查平臺各項搜索功能,經過多步相對繁瑣的操作,最終才能得到關于該企業更深入、完善的信息。但這對于絕大多數新用戶而言,使用門檻過高,不利于在更廣泛的范圍內打通信息通路。
此外,搜索引擎模式,商查平臺反饋給用戶的是大量基礎數據,而不是直接的答案。如果是大型集團公司,則可能有成千上萬的基礎企信數據,如此巨大的瀏覽量對于用戶而言是一個不小的負擔。這樣的商業信息查詢服務,還停留在工具階段,不能稱之為強大的商業助手。同時,企查查擁有查企業、查老板、查風險、查招標、信用大數據、風險大數據等數百類產品服務,用戶很難系統學習掌握,基于知彼阿爾法大模型,企查查后續將上線的對話產品,則可以跳過繁瑣的檢索步驟,用對話的方式充分釋放企查查各項產品能力,為用戶提供‘有整體性的、易于理解的、具備高價值的’商業信息服務。
而用戶如果使用ChatGPT等大語言模型搜索高價值的企信數據時,會發現明顯的問題:由于缺乏專業的數據庫支持,通過ChatGPT搜索的企業工商、信用數據皆來源于公開的互聯網數據,無法保證數據的準確性,與此同時,一些高質量、商業化的企信數據庫并不對其開放。缺乏專業數據庫的支持,ChatGPT等大語言模型在商查領域的分析都是“無米之炊”,甚至出現“無中生有”的狀況。而知彼阿爾法商查大模型則是基于企查查全量可信數據進行的深度訓練,可為用戶提供專業的企信數據,及多樣化的分析結果。
AIGC+企業信用數據庫,商查服務方式再進化
隨著人工智能步入“AIGC時代”,陳德強認為,這將徹底改變數據的查詢和使用模式?!靶袠I數據規模達到了一定量級后,數據查詢方式發生了變化,AIGC+企業信用數據庫,可以把數據完全利用起來?!睋榻B,企查查目前發布的知彼阿爾法商查大模型是全球首款商業查詢大模型,該模型基于企查查覆蓋的全球企業信用數據進行訓練,相較于傳統商查平臺,后續基于知彼阿爾法商查大模型構建的產品實現了以下三個方面的變革:
人機交互方面實現運用自然語言對話,即能完成復雜的查詢步驟。用戶要查詢某項商業數據,不再局限于關鍵詞搜索,而是可以用一段自然語言的描述,來提出自己的需求,降低用戶門檻。例如,當用戶想要對某公司進行淺度盡調時,可以提出“某公司行業地位怎么樣?有哪些競爭對手?”知彼阿爾法大模型會從用戶的描述中理解其需求,并將需求“解構”成對應的指令。這種方式,當用戶在了解一家企業時,面對的知彼阿爾法大模型就像是一個專業的商業調查助手,而不是一個沒有智慧的工具。
技術方面針對用戶所提需求實現了秒級響應。知彼阿爾法大模型能夠根據用戶語義,調取企查查企信數據,然后再把“整理、歸納”后的結果呈現給用戶。這種情況下,用戶得到的不再是一堆零散信息,而是一個完整的答案。為提升響應速度,知彼阿爾法大模型已全量接入企查查超算平臺,秒級時間就能完成查詢、瀏覽、總結、結構化輸出等繁冗步驟。
新增“多輪對話”功能,讓商查平臺具備了邏輯思考能力。知彼阿爾法大模型“多輪對話”功能,是該模型優于以往企查查對話式AI的一大亮點。借助這一能力,知彼阿爾法大模型可以引導用戶通過多輪對話的方式,一步步進行更深入的分析。在多輪對話中,用戶可以在已經得到的結果基礎上,提出新的指令,從而問出更深入的問題。這種方式,讓知彼阿爾法大模型不僅成為用戶的助手,還可以是“引路人”,循序漸進的引導用戶自己去尋求答案。
相關文章: