<td id="wa4yw"><option id="wa4yw"></option></td>
  • <td id="wa4yw"><kbd id="wa4yw"></kbd></td><noscript id="wa4yw"><source id="wa4yw"></source></noscript>
    <bdo id="wa4yw"><kbd id="wa4yw"></kbd></bdo><input id="wa4yw"></input>
    <table id="wa4yw"><kbd id="wa4yw"></kbd></table>
  • <td id="wa4yw"><option id="wa4yw"></option></td>
    <option id="wa4yw"></option>
  • <table id="wa4yw"></table>

  • 人工智能(AI)在給出準確答案的同時,也會有一些“胡亂輸出”令人難辨真假,這被稱為“幻覺”(hallucination)。而新一期《自然》雜志發表的一項研究報道了一種新方法,能檢測大語言模型(LLM)產生的“幻覺”,即該方法能測量生成回答的含義的不確定性,或能提升LLM輸出答案的可靠性。

    類似ChatGPT和Gemini等LLM,是能閱讀和生成自然人類語言的AI系統。不過,這類系統很容易產生所謂“幻覺”,即生成不準確或沒有意義的內容。檢測LLM出現的這種錯誤非常難,因為這些回答的呈現方式看起來很可信。

    英國牛津大學研究團隊此次嘗試量化一個LLM產生此類錯誤的程度,從而判斷生成的內容有多忠于提供的源內容。他們的方法能檢測“編造”——這是幻覺的一個子類別,特指不準確和隨意的內容,常出現在LLM缺乏某類知識的情況下。這種方法考慮了語言的微妙差別,以及回答如何能以不同的方式表達,從而擁有不同的含義。團隊的研究表明,他們的方法能在LLM生成的個人簡介,以及關于瑣事、常識和生命科學這類話題的回答中識別出“編造”內容。

    在同時發表的新聞與觀點文章中,澳大利亞皇家墨爾本理工大學科學家指出,該方法由一個LLM完成,并通過第三個LLM進行評價,等于在“以毒攻毒”。文章寫道,“用一個LLM評估一種基于LLM的方法似乎是在循環論證,而且可能有偏差。”不過,團隊指出他們的方法有望幫助用戶理解在哪些情況下使用LLM的回答需要注意,也意味著可以提高LLM在更多應用場景中的置信度。

     


    相關文章

    AI創新助力解決納米遞送難題

    “以AI創新解決納米遞送難題,不斷推進自主研發的創新進程,為CGT(細胞與基因治療)產業高質量發展提供中國遞送方案。”近日,劑泰科技基于該系統孵化的OpenCGT(細胞與基因治療)平臺在北京大興落地,......

    AI創新助力解決納米遞送難題

    “以AI創新解決納米遞送難題,不斷推進自主研發的創新進程,為CGT(細胞與基因治療)產業高質量發展提供中國遞送方案。”近日,劑泰科技基于該系統孵化的OpenCGT(細胞與基因治療)平臺在北京大興落地,......

    AI設計的仿生水下黏膠問世

    《自然》雜志6日發表的一篇封面文章報道了一種由人工智能(AI)模型輔助設計的超黏水凝膠。這種膠以自然界存在的黏附蛋白為靈感,能修補水管漏洞并在水下黏住物體,具有一系列潛在應用。要設計出在潮濕環境中具有......

    AI設計的仿生水下黏膠問世

    《自然》雜志6日發表的一篇封面文章報道了一種由人工智能(AI)模型輔助設計的超黏水凝膠。這種膠以自然界存在的黏附蛋白為靈感,能修補水管漏洞并在水下黏住物體,具有一系列潛在應用。要設計出在潮濕環境中具有......

    K時評:上海“AI+制造”=?

    全球AI領域備受關注的世界人工智能大會剛落幕,上海抓緊又忙活起來了。日前,上海市政府常務會議原則同意《上海市加快推動“AI+制造”發展的實施方案》。該文件明確,必須把握人工智能賦能制造業的戰略機遇,以......

    K時評:上海“AI+制造”=?

    全球AI領域備受關注的世界人工智能大會剛落幕,上海抓緊又忙活起來了。日前,上海市政府常務會議原則同意《上海市加快推動“AI+制造”發展的實施方案》。該文件明確,必須把握人工智能賦能制造業的戰略機遇,以......

    張錦:走入AI與全球科技發展的“下半場”

    當前,科學研究向極宏觀拓展、向極微觀深入、向極端條件邁進、向極綜合交叉發力,技術創新的顛覆性、擴散性、滲透性特征更加凸顯,科學、技術、工程和經濟社會發展的邊界趨于融合、模糊。這標志著全球科研范式正處在......

    張錦:走入AI與全球科技發展的“下半場”

    當前,科學研究向極宏觀拓展、向極微觀深入、向極端條件邁進、向極綜合交叉發力,技術創新的顛覆性、擴散性、滲透性特征更加凸顯,科學、技術、工程和經濟社會發展的邊界趨于融合、模糊。這標志著全球科研范式正處在......

    AI為核心的“虛擬實驗室”創建,旨在解決復雜問題并提高科研效率

    美國斯坦福大學醫學院團隊開發出一種名為“虛擬實驗室”的創新工具。該系統以人工智能(AI)為核心,結合跨學科科學家團隊,旨在解決復雜問題并加速科學發現進程,可在多領域極大提高科研效率。相關論文29日發表......

    AI為核心的“虛擬實驗室”創建,旨在解決復雜問題并提高科研效率

    美國斯坦福大學醫學院團隊開發出一種名為“虛擬實驗室”的創新工具。該系統以人工智能(AI)為核心,結合跨學科科學家團隊,旨在解決復雜問題并加速科學發現進程,可在多領域極大提高科研效率。相關論文29日發表......

    <td id="wa4yw"><option id="wa4yw"></option></td>
  • <td id="wa4yw"><kbd id="wa4yw"></kbd></td><noscript id="wa4yw"><source id="wa4yw"></source></noscript>
    <bdo id="wa4yw"><kbd id="wa4yw"></kbd></bdo><input id="wa4yw"></input>
    <table id="wa4yw"><kbd id="wa4yw"></kbd></table>
  • <td id="wa4yw"><option id="wa4yw"></option></td>
    <option id="wa4yw"></option>
  • <table id="wa4yw"></table>
  • XVideos