東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。 TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得模型更適用于廣泛的應用場景,為用戶提供了更準確、更深入的信息處理和生成能力。 TechGPT2.0發布后,受到了學術界的廣泛關注,“開放知識圖譜”“機器學習算法與自然語言處理”“始智AI”等平臺相繼對TechGPT2.0的工作進行了介紹。并且,相應的模型也開源到了GitHub、HuggingFace、始智AI、魔塔等國內外開源社區,并提供了在線體驗服務。 據悉,與研究小組2023年6月26日發布的TechGPT-1.0相比,TechGPT2.0新加了許多領域知識。除了TechGPT-1.0 所具備的計算機科學、材料、機械、冶金、金......閱讀全文
東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。 TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得
東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得模型更適
壓縮算法為大語言模型“瘦身”
據美國科學促進會旗下網站19日報道,美國普林斯頓大學和斯坦福大學團隊開發出一種新壓縮算法CALDERA,能精簡大型語言模型(LLM)的海量數據,為LLM“瘦身”。這項算法不僅有助保護數據隱私、節約能源、降低成本,還能推動LLM在手機和筆記本電腦上高效使用。團隊舉例稱,當人們使用ChatGPT時,請求
8個小技巧“用好”大語言模型
用大語言模型,還需要技巧?在人們的印象中,這是個極其簡單的操作:只需輸入一個問題,立刻就能得到回答。但實際上,如何有效地與這些人工智能模型互動,發揮出它們的最大潛力,卻是一個經常被忽視的話題。中國科學技術大學心理學系特任研究員林志成關注到這一話題,并在他最近的評論文章中提供了一系列的策略和指導,希望
新引擎實現大語言模型推理速度顯著提升
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm
新型AI芯片將大語言模型能耗減半
美國俄勒岡州立大學科研團隊研發出一種新型AI芯片,成功將大語言模型的能耗降低50%。這項成果于近期在波士頓舉行的IEEE定制集成電路會議上發布,是半導體領域的重大突破,有望成為解決大語言模型高能耗問題的“綠色鑰匙”。 當前,以谷歌“雙子座”和OpenAI的GPT-4為代表的大語言模型,因海量參
大語言模型在線辯論說服力超人類
實驗設計示意圖。圖片來源:英國《自然·人類行為》在線版《自然·人類行為》19日發表的一項人工智能(AI)研究發現,在線辯論中,GPT-4一類的大語言模型(LLM)如能根據對手的個性化信息調整它們的論據,其說服力比人類辯手高出64%。研究結果顯示了GPT-4生成有針對性和說服力論據的能力,揭示出AI工
“AI+教育”,復旦推出大語言模型助力新生報到
8月25日,是復旦大學本科生新生報到的日子。來自全國各地和全球40多個國家的4300余名2024級本科新生,開啟了在復旦的求學生涯。新生報道現場。為幫助來自世界各地的新同學盡快融入復旦大學,學校基于大語言模型,推出“復旦迎新助手”智能Agent。作為新生的貼心小幫手,大語言模型為新同學在迎新階段提供
日本發布大規模語言模型
科技日報訊?(記者李楊)東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。“Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基于日語敬語進行自然對
日本發布大規模語言模型
東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。 “Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基于日語敬語進行自然對話,并展現出在人
AI語言模型“提速”藥物發現
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美國麻省理工學院和塔夫茨大學研究人員設計出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標蛋白與潛在的藥物分子相匹配,而無需執行計算分子結
科研人員利用大語言模型解釋調節睡眠的分子機制
華中科技大學生命學院張珞穎團隊和薛宇團隊在Nature Communications雜志上合作發表了題為“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
科研人員利用大語言模型解釋調節睡眠的分子機制
華中科技大學生命學院張珞穎團隊和薛宇團隊在Nature Communications雜志上合作發表了題為“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
首個種業大語言模型“豐登”發布
4月28日,中國農業大學生物學院教授王喜慶團隊聯合上海人工智能實驗室、崖州灣國家實驗室發布首個種業大語言模型“豐登”(SeedLLM)。種業大語言模型“豐登”。中國農業大學供圖“豐登”集成了先進的人工智能技術(書生·浦語2.0)與大數據分析,通過深入學習我國迄今發布的科研文獻、科技書籍、種企報告和歷
清華團隊與合作者推出大語言模型RealSafeR1
2月23日,清華大學與瑞萊智慧聯合團隊推出大語言模型RealSafe-R1。研發團隊代表介紹說,實驗數據表明RealSafe-R1安全性提升顯著,“安全增強版DeepSeek”可為更多應用提供可靠堅實基座。連日來,國產開源大模型DeepSeek的優異表現備受關注,其在自然語言處理和多任務推理方面的能
微調大語言模型,科學家開發化學文本挖掘新方法
6月7日,中國科學院上海藥物研究所研究員鄭明月課題組在五項化學文本挖掘任務上對多個大語言模型的能力進行了全面綜合的探究,展現了微調大語言模型成為一種通用高效的生成式文本挖掘方法,為大模型的落地應用提供參考。相關研究發表于《化學科學》。?近兩年,以ChatGPT為代表的大語言模型(LLM)引領了人工智
360智腦通過中國信通院可信AIGC大語言模型功能評估
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502739.shtm6月12日,360智腦的360GPT-S2-V8型號產品獲得了中國信息通信研究院(以下簡稱“中國信通院”)“可信AIGC大語言模型基礎能力”評估報告(以下簡稱“報告”),報告顯示必選項
日本將開發更強日語能力的“大語言模型”人工智能技術
據共同社消息,日本東北大學和日本東京工業大學等團隊計劃開發一種更強日語能力的“大語言模型”,作為生成式人工智能(AI)的基礎技術。該團隊將利用理化學研究所的超級計算機“富岳”學習大量數據,并將在本年度內逐步公開。這一技術的開發將使國內企業和研究人員能夠為自己的公司的服務或研究而自行改良。生成式AI可
ChatGPT進入課堂:語言模型如何改變教育
最近,教育心理學家羅納德·貝格托(Ronald Beghetto)以一種引人注目的方式引領一群研究生和教育專業人員,與一系列以創造力為中心的聊天機器人進行了交流。這些聊天機器人由貝格托設計,即將托管在亞利桑那州立大學(ASU)設立的平臺上。這些機器人使用與ChatGPT相同的人工智能(AI)技術,目
神經機器模型能翻譯200種語言
科技日報北京6月5日電?(記者張夢然)《自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是
神經機器模型能翻譯200種語言
自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是普遍可及的,這類語言被稱為低資源語言。一
華大基因發布大語言模型驅動新方法,助力罕見病精準防控
人工智能(AI)技術隨著科技的飛速發展已廣泛滲透至多個領域。在生命健康層面,AI憑借其獨特優勢在推動基因組醫學的創新發展中扮演著重要角色,尤其是在罕見遺傳疾病診斷中展現出了巨大的潛力。然而,利用基因測序技術對海量的基因組變異進行大規模、高效精準的致病因素識別,仍然是一個挑戰。因此,基于基因檢測大
科研人員開發出RNA基礎語言模型
在真核生物中,RNA轉錄、剪接、翻譯和降解等生物學過程受到順式調控元件、RNA結構和反式作用因子的調控。解析RNA多層次調控,對研究基因表達分子機制和設計RNA藥物具有重要意義。但是,由于調控復雜和數據量不足,構建RNA調控的預測模型面臨挑戰。 近日,中國科學院上海營養與健康研究所研究員張國慶
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
我國學者提出用好大語言模型實用策略
當前,大語言模型的應用日益廣泛,覆蓋從文本生成到復雜問題解決等多個領域,如何更好利用AI工具?記者10日從中國科學技術大學獲悉,該校心理學系林志成特任研究員近日在其評論文章中研究提出一項實用策略,幫助更好理解和利用先進的人工智能工具,有效發揮人工智能模型交互的最大潛力。在《自然人類行為》(Natur
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
我國學者提出用好大語言模型實用策略
中新網合肥5月10日電 (記者 吳蘭)當前,大語言模型的應用日益廣泛,覆蓋從文本生成到復雜問題解決等多個領域,如何更好利用AI工具?記者10日從中國科學技術大學獲悉,該校心理學系林志成特任研究員近日在其評論文章中研究提出一項實用策略,幫助更好理解和利用先進的人工智能工具,有效發揮人工智能模型交互的最
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則
人工智能新模型可解碼DNA隱藏“語言”
科技日報北京8月6日電?(記者張佳欣)DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將