av在线亚洲天堂|无遮挡成人性视频|激情激情激情黄色|超碰人人射人人射|色琪琪五月色眯眯|亚洲公交中文字幕校园人妻91|少妇自慰www久久|欧洲精品黄色视频|欧日美高清在线观看|一区二区三区噜噜

  成果名稱 完成單位 報(bào)告編號(hào)
  多模態(tài)語(yǔ)料數(shù)據(jù)智能平臺(tái) 北京滴普科技有限公司 中促會(huì)評(píng)字[2024]第044號(hào)
成果簡(jiǎn)介
一、課題來(lái)源與背景
大數(shù)據(jù)時(shí)代,面對(duì)數(shù)據(jù)類型和來(lái)源的多樣化,企業(yè)需要充分利用自然語(yǔ)言處理、音頻、視頻等領(lǐng)域的交叉融合技術(shù),實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的統(tǒng)一處理和分析。針對(duì)上述需求,本項(xiàng)目提供了有效的解決方案并完成了多模態(tài)語(yǔ)料數(shù)據(jù)智能平臺(tái)的產(chǎn)品研發(fā)。

二、技術(shù)原理及性能指標(biāo)
多模態(tài)語(yǔ)料數(shù)據(jù)智能平臺(tái)是一款能在保證數(shù)據(jù)安全的基礎(chǔ)上具備結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的全鏈路實(shí)時(shí)的采集、處理、存儲(chǔ)、分析等功能的智能化數(shù)據(jù)管理產(chǎn)品。
1.在數(shù)據(jù)平臺(tái)開(kāi)發(fā)、分析等各環(huán)節(jié)引入大語(yǔ)言模型,省去人工配置的繁瑣工序。
2.在結(jié)構(gòu)化數(shù)據(jù)處理環(huán)節(jié)中,采用數(shù)據(jù)湖技術(shù)(Iceberg)作為結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一表格式,比傳統(tǒng)的hive表格式有更強(qiáng)的先進(jìn)性;采用存算分離架構(gòu),有利于降低成本。
3.針對(duì)多模態(tài)數(shù)據(jù)的不同特點(diǎn),選擇對(duì)象存儲(chǔ)作為平臺(tái)的底層存儲(chǔ)系統(tǒng),成本低廉,且使用協(xié)議統(tǒng)一規(guī)范(S3協(xié)議),在云上容易獲取,具備不同類型數(shù)據(jù)存儲(chǔ)的特點(diǎn),冷熱數(shù)據(jù)分離既提高了存儲(chǔ)效率也保證了存儲(chǔ)容量的幾乎無(wú)限制擴(kuò)展。
4.云原生化能帶來(lái)資源良好的隔離性和彈性,底層硬件和操作系統(tǒng)的適配標(biāo)準(zhǔn)化,具備了一處打包,多處運(yùn)行的特質(zhì),使得平臺(tái)的可移植性得到提高。

三、技術(shù)的創(chuàng)造性與先進(jìn)性
1.主要?jiǎng)?chuàng)新點(diǎn)
(1)研發(fā)了一種數(shù)據(jù)全鏈路實(shí)時(shí)處理架構(gòu),實(shí)現(xiàn)了數(shù)據(jù)的實(shí)時(shí)抓取和智能分析;開(kāi)發(fā)了冷溫?zé)釘?shù)據(jù)自動(dòng)分區(qū)的輕量級(jí)智能遷移技術(shù),提高了多模態(tài)語(yǔ)料數(shù)據(jù)的實(shí)時(shí)存取效率。
(2)在原有的NLP to SQL基礎(chǔ)上,結(jié)合企業(yè)級(jí)數(shù)據(jù)平臺(tái)較為完整的指標(biāo)體系特點(diǎn),提出了Metric Query Language架構(gòu),實(shí)現(xiàn)了基于自然語(yǔ)言的多模態(tài)語(yǔ)料數(shù)據(jù)統(tǒng)一分析處理。
(3)研發(fā)了小文件動(dòng)態(tài)智能合并子系統(tǒng),提升了存儲(chǔ)效率和查詢速度。
(4)研制了結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的語(yǔ)料數(shù)據(jù)智能平臺(tái),在湖倉(cāng)一體的架構(gòu)里實(shí)現(xiàn)對(duì)多模態(tài)數(shù)據(jù)的動(dòng)態(tài)存取和分析,支撐基于數(shù)據(jù)的業(yè)務(wù)決策場(chǎng)景。
2.主要技術(shù)優(yōu)勢(shì)
(1)該平臺(tái)解決了大型央國(guó)企的核心數(shù)據(jù)平臺(tái)多級(jí)管理的問(wèn)題,采用了多湖聯(lián)邦的技術(shù)架構(gòu),可以大幅降低數(shù)據(jù)ETL成本,減少數(shù)據(jù)遷移,實(shí)現(xiàn)多級(jí)數(shù)據(jù)湖之間的跨湖訪問(wèn)及管控治理。
(2)該平臺(tái)采用體系化的湖倉(cāng)一體的架構(gòu),實(shí)現(xiàn)了Direct lake方式降低出湖建倉(cāng)成本,資源利用率從30%提升到60%,并以多云存儲(chǔ)的技術(shù)架構(gòu)來(lái)實(shí)現(xiàn)流批統(tǒng)一存儲(chǔ),降低數(shù)據(jù)存儲(chǔ)成本;并基于Data Fabric的技術(shù)架構(gòu)理念,實(shí)現(xiàn)一站式的數(shù)據(jù)開(kāi)發(fā)治理分析平臺(tái),降低維護(hù)成本。
(3)該平臺(tái)支持了Gateway智能路由計(jì)算網(wǎng)關(guān),在此基礎(chǔ)上實(shí)現(xiàn)了支持分布式和多租戶,統(tǒng)一SQL接口對(duì)接不同工作負(fù)載,用于在Lakehouse上提供Serverless SQL,為用戶提供更好的數(shù)據(jù)服務(wù)。
(4)多模態(tài)語(yǔ)料數(shù)據(jù)智能平臺(tái)在技術(shù)架構(gòu)上提供了統(tǒng)一的用戶體驗(yàn),以低代碼方式開(kāi)發(fā)指標(biāo),實(shí)現(xiàn)業(yè)務(wù)和數(shù)據(jù)的口徑一致;并實(shí)現(xiàn)開(kāi)發(fā)治理一體化,從根源上保障數(shù)據(jù)質(zhì)量;在智能化方面通過(guò)大模型智能助手實(shí)現(xiàn)語(yǔ)義化智能分析。

四、技術(shù)的成熟程度,適用范圍和安全性
經(jīng)過(guò)三年的科學(xué)研究與技術(shù)創(chuàng)新工作,該技術(shù)性能指標(biāo)達(dá)到任務(wù)書(shū)要求,創(chuàng)新使用多模態(tài)數(shù)據(jù)源安全沙箱,實(shí)現(xiàn)了數(shù)據(jù)安全、模型安全、應(yīng)用安全,產(chǎn)品授權(quán)了20余項(xiàng)技術(shù)專利、擁有25項(xiàng)軟件著作權(quán)登記、獲得了中國(guó)信通院“可信研創(chuàng)”認(rèn)證,代碼自主率達(dá)到94.31%;并具備云原生、低成本存儲(chǔ)、高性能計(jì)算、簡(jiǎn)單易用、安全可靠等特點(diǎn)。該產(chǎn)品已達(dá)到成熟應(yīng)用階段,應(yīng)用于200+大中型企業(yè)。

五、應(yīng)用情況及存在的問(wèn)題
目前,該產(chǎn)品已經(jīng)在大型國(guó)央企、裝備軍工、半導(dǎo)體、能源、工程設(shè)計(jì)、基礎(chǔ)制造、商業(yè)綜合等行業(yè)領(lǐng)域超200+企業(yè)實(shí)現(xiàn)了產(chǎn)品配套及應(yīng)用落地,為企業(yè)數(shù)字化轉(zhuǎn)型搭建了數(shù)據(jù)智能基礎(chǔ)設(shè)施。
(1)大型國(guó)央企:如華潤(rùn)、交通集團(tuán)、深圳/佛山/無(wú)錫市區(qū)大數(shù)據(jù)局等地方國(guó)企數(shù)據(jù)平臺(tái)底座;
(2)裝備軍工:如航空發(fā)動(dòng)機(jī)的設(shè)計(jì)(624)、發(fā)動(dòng)機(jī)的生產(chǎn)制造(420)、航發(fā)維修(5719)等軍工裝備產(chǎn)業(yè)鏈企業(yè),貫穿從需求、設(shè)計(jì)、制造、供應(yīng)鏈、銷(xiāo)售到售后全業(yè)務(wù)過(guò)程;
(3)能源行業(yè):中石油、中海油、中石化全面進(jìn)入,從勘探開(kāi)發(fā)、煉化、銷(xiāo)售、運(yùn)營(yíng)等能源全鏈條產(chǎn)業(yè)的數(shù)據(jù)智能服務(wù);
(4)基礎(chǔ)制造:如長(zhǎng)安新能源汽車(chē)、巴扎海船舶、納愛(ài)斯集團(tuán)、四川重慶機(jī)電、陜藥集團(tuán)、威高集團(tuán)等企業(yè)全鏈路業(yè)務(wù)數(shù)據(jù)管理與分析服務(wù)。

六、歷年獲獎(jiǎng)情況
2023大數(shù)據(jù)“星河”案例獎(jiǎng)、2022年中國(guó)北京創(chuàng)新創(chuàng)業(yè)大賽第十一屆中國(guó)創(chuàng)新創(chuàng)業(yè)大賽北京賽區(qū)成長(zhǎng)組一等獎(jiǎng)、國(guó)家標(biāo)準(zhǔn)企業(yè)競(jìng)爭(zhēng)力5A級(jí)、2019及2020年中關(guān)村前沿大賽第四名、HICOOL2023全球創(chuàng)業(yè)大賽優(yōu)勝獎(jiǎng)等。
成果完成人
1.趙杰輝  2.楊磊  3.王兵  4.柏海峰  5.馮森  6.馬歡  7.馮吉坤  8.張趙中  9.劉波  10.許俊雄  11.俞志剛  12.王永進(jìn)  13.王琳  14.紅樂(lè)  15.李暢  
成果評(píng)價(jià)情況
  評(píng)價(jià)單位: 中國(guó)民營(yíng)科技促進(jìn)會(huì) 報(bào)告編號(hào): 中促會(huì)評(píng)字[2024]第044號(hào) 評(píng)價(jià)日期: 2024-04-02
  組織單位: 中國(guó)民營(yíng)科技促進(jìn)會(huì)科技成果轉(zhuǎn)化辦公室 項(xiàng)目負(fù)責(zé): 張研 成果管理: 18911978313
評(píng)價(jià)意見(jiàn)
1.項(xiàng)目提供的評(píng)價(jià)資料齊全,符合評(píng)價(jià)要求。
2.項(xiàng)目的創(chuàng)新點(diǎn)和技術(shù)特點(diǎn)如下:
(1)研發(fā)了一種數(shù)據(jù)全鏈路實(shí)時(shí)處理架構(gòu),實(shí)現(xiàn)了數(shù)據(jù)的實(shí)時(shí)抓取和智能分析;開(kāi)發(fā)了冷溫?zé)釘?shù)據(jù)自動(dòng)分區(qū)的輕量級(jí)智能遷移技術(shù),提高了多模態(tài)語(yǔ)料數(shù)據(jù)的實(shí)時(shí)存取效率。
(2)在原有的 NLP to SQL基礎(chǔ)上,結(jié)合企業(yè)級(jí)數(shù)據(jù)平臺(tái)較為完整的指標(biāo)體系特點(diǎn),提出了Metric Query Language架構(gòu),實(shí)現(xiàn)了基于自然語(yǔ)言的多模態(tài)語(yǔ)料數(shù)據(jù)統(tǒng)一分析處理。
(3)研發(fā)了小文件動(dòng)態(tài)智能合并子系統(tǒng),提升了存儲(chǔ)效率和查詢速度。
(4)研制了結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的語(yǔ)料數(shù)據(jù)智能平臺(tái),在湖倉(cāng)一體的架構(gòu)里實(shí)現(xiàn)對(duì)多模態(tài)數(shù)據(jù)的動(dòng)態(tài)存取和分析,支撐基于數(shù)據(jù)的業(yè)務(wù)決策場(chǎng)景。
3.項(xiàng)目產(chǎn)品已通過(guò)中國(guó)賽寶實(shí)驗(yàn)室軟件測(cè)試。
4.該項(xiàng)目已獲得發(fā)明專利授權(quán)20件,軟件著作權(quán)25項(xiàng)。
5.該技術(shù)成果已在中國(guó)航發(fā)成都發(fā)動(dòng)機(jī)公司、中核裝備技術(shù)研究(上海)有限公司、重慶長(zhǎng)安新能源汽車(chē)科技有限公司、四川九洲電器集團(tuán)有限責(zé)任公司、四川航天烽火伺服控制技術(shù)有限公司(國(guó)營(yíng)7111廠)、中航工業(yè)燃?xì)鉁u輪研究院(624所)、航天工業(yè)發(fā)展股份有限公司、上海集成電路研發(fā)中心、北京奕斯偉科技集團(tuán)有限公司、廣汽集團(tuán)等應(yīng)用。
評(píng)價(jià)委員會(huì)認(rèn)為該項(xiàng)目綜合技術(shù)達(dá)到國(guó)內(nèi)領(lǐng)先水平,一致同意通過(guò)科技成果評(píng)價(jià)。
評(píng)價(jià)專家
姓名 工作單位 職稱 從事專業(yè)
張向陽(yáng) 中國(guó)科學(xué)院北京軟件工程研制中心 正高軟件
宮云戰(zhàn) 北京郵電大學(xué)計(jì)算機(jī)學(xué)院 正高軟件
李紅輝 北京交通大學(xué)網(wǎng)絡(luò)管理研究中心 正高軟件
周迎 科技部火炬中心 正高科技管理
張序國(guó) 北京大學(xué)國(guó)家高新區(qū)發(fā)展戰(zhàn)略研究院 正高科技管理
WeChat 微信公眾號(hào)
WeChat
Hotline 服務(wù)熱線
Hotline