<td id="wa4yw"><option id="wa4yw"></option></td>
  • <td id="wa4yw"><kbd id="wa4yw"></kbd></td><noscript id="wa4yw"><source id="wa4yw"></source></noscript>
    <bdo id="wa4yw"><kbd id="wa4yw"></kbd></bdo><input id="wa4yw"></input>
    <table id="wa4yw"><kbd id="wa4yw"></kbd></table>
  • <td id="wa4yw"><option id="wa4yw"></option></td>
    <option id="wa4yw"></option>
  • <table id="wa4yw"></table>
  • 發布時間:2012-06-27 08:39 原文鏈接: 李國杰院士:大數據成為信息科技新關注點

      最近,在信息科技領域,繼云計算之后,“大數據”一詞成為媒體爭相追逐的焦點。對此,中國工程院院士、中科院計算技術研究所首席科學家李國杰接受《中國科學報》記者采訪時說:“科技界應高度關注大數據研究這一新的發展方向,從大數據應用中發現挑戰性的科學問題,推動以大數據為基礎的第四科學范式,促進形成新型交叉學科:網絡數據科學。”

      信息社會的變化

      “60年前數字計算機使得信息可讀,20年前因特網使得信息可獲得,10年前搜索引擎爬蟲將互聯網變成一個數據庫,現在Google及類似公司處理海量語料庫如同一個人類社會實驗室。”在近日召開的香山科學會議第424次學術討論會上,李國杰引用美國《連線》雜志主編安德森的一段話作為他演講的開場白。

      維基百科定義:“大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。”“大數據”具有數據量大、種類多和速度快等特點,涉及互聯網、經濟、生物、醫學、天文、氣象、物理等眾多領域。

      國際數據公司(IDC)的數字宇宙研究報告稱,2011年全球被創建和被復制的數據總量為1.8ZB,并預測到2020年,全球將擁有35ZB的數據量。

      “數據成本下降促使數據量急劇增長,而新的數據源和數據采集技術的出現使數據類型增多,” 李國杰告訴記者,“各種非結構化的數據又增加了大數據的復雜性。”

      2012年3月29日,美國政府撥款2億美元啟動“大數據研究和發展倡議”計劃。李國杰認為,這是一個標志性事件,說明繼集成電路和互聯網之后,大數據已成為信息科技關注的重點。

      重視大數據提出的技術挑戰

      針對美國有關大數據研究的計劃,李國杰對記者說,這項大數據計劃最為重視的是數據工程而非數據科學,主要考慮大數據分析算法和系統的效率。對我國而言,大數據工程的技術挑戰也應當得到重視。

      幾百年來,科學研究一直在做“從薄到厚”的事情,把“小數據”變成“大數據”。李國杰認為,現在要做的則是“從厚到薄”,要把“大數據”變成“小數據”。“許多數據是重復的或者沒有價值的,未來,我們的任務不是獲取越來越多的數據,而是數據的去冗分類、去粗取精。”他說。

      他進一步指出,現有數據中心技術難以滿足大數據的應用需求,整個IT架構的革命性重構勢在必行。首先,存儲能力的增長遠遠趕不上數據的增長,設計最合理的分層存儲架構已成為信息系統的關鍵。其次,數據的移動已成為信息系統最大的開銷,信息系統需要從數據圍著處理器轉改變為處理能力圍著數據轉。此外,高擴展高可用的數據分析技術、新的數據表示方法、高通量計算機等都是亟待解決的技術問題。

      基本科學問題仍未達成共識

      盡管學術界已注意到大數據帶來的科學挑戰,但對一些基本的科學問題仍未形成共識。

      許多學者認為,計算機科學是關于算法的科學,數據科學是關于數據的科學。有些學者試圖將“數據”當成一個“自然體”來研究,即“數據界”。

      然而,在李國杰看來,脫離各個領域的“物理世界”,作為客觀事物間接存在形式的“數據界”的共性問題還不清楚。

      他認為,不同于數據挖掘和統計學,從事大數據研究的學者應當更重視統計分布背后的知識和規律。

      “大數據”的復雜性主要來自個體之間的聯系。“數據背后是網絡,網絡背后是人,研究網絡數據實際上是研究人組成的社會網絡。”李國杰指出,“‘網絡數據科學’應是從整體上研究社會的一門科學,其重點是研究數據背后的社會網絡。”

      因此,大數據已成為聯系人類社會、物理世界和信息空間的紐帶,需要構建融合人、機、物三元世界的統一的信息系統。

    相關文章

    中國科學院召開2023年度科技幫扶工作總結交流會議

    12月27日,中國科學院召開2023年度科技幫扶工作總結交流會議。中國科學院副院長、黨組成員周琪出席會議并講話。院幫扶辦介紹了2023年中國科學院科技幫扶工作整體推進情況和2024年工作考慮;相關院屬......

    資本賦能科技新質生產力加速釋放

    2023年,資本市場科技賽道“群星璀璨”,算力、AI大模型、數據要素、機器人等前沿科技領域頻頻取得重大突破,并在資本市場輪番掀起熱潮。中央財經大學數字經濟融合創新發展中心主任陳端表示:“這些科技熱點其......

    數據賦能:利用深度學習對短文本產品名稱分類

    一、研究背景在數字化浪潮的沖擊下,基于產品質量安全監管的信息化基礎,運用大數據、自然語言處理、機器學習等技術,讓信息橫向在不同區域間、縱向在各級市場監管部門流通,是一個有重要意義且需要我們在業務支撐工......

    利用深度學習對短文本產品名稱分類的研究

    一、研究背景在數字化浪潮的沖擊下,基于產品質量安全監管的信息化基礎,運用大數據、自然語言處理、機器學習等技術,讓信息橫向在不同區域間、縱向在各級市場監管部門流通,是一個有重要意義且需要我們在業務支撐工......

    冉冉升起的新星——2023科技突破振奮人心!

    科技創新是百年未有之大變局的一個“關鍵變量”,也是高質量發展的“最大增量”。2023年,我國科技事業收獲豐碩成果。這一年,大飛機C919完成首次商業載客飛行,國產大型郵輪制造實現“零的突破”,全球首顆......

    2023年北京市“隱形冠軍”企業名單公布

    各有關單位:為加強企業梯隊建設,推動企業高質量發展,我局會同市工商聯組織開展了2023年北京市隱形冠軍企業的征集和認定工作。經企業申報、審查和評審,現將擬認定的2023年北京市隱形冠軍企業名單予以公示......

    新型類腦晶體管模仿人類智能,可在室溫下節能執行聯想學習

    美國西北大學、波士頓學院和麻省理工學院研究人員從人腦中汲取靈感,開發出一種能夠進行更高層次思維的新型突觸晶體管,可像人腦一樣同時處理和存儲信息。在新的實驗中,研究人員證明晶體管對數據進行分類的能力,超......

    董宇輝“小作文”,暴漲的不止餐飲業?

    A股終于“吃到瓜”了。最近東方甄選“小作文”事件刷屏,A股并未映射太多交易機會。昨晚,俞敏洪表示,董宇輝即將成立獨立工作室開展文旅等業務。今天上午,餐飲旅游板塊爆發,領漲A股,曲江文旅、西安旅游等個股......

    揭秘全球儀器領域的巨頭TOP20,你了解現在哪些科技公司誰在稱霸市場?

    在當今不斷擴大的全球市場中,儀器公司之間的競爭異常激烈。由于有很多參與者爭奪前列,要了解誰是表現最佳的公司可能是具有挑戰性的。因此,我們編制了一份全球前20家上市儀器公司收入排名的列表,以幫助您及時了......

    CancerResearchUK,與GuardantHealth簽署研究和數據共享協議

    GuardantHealth、CancerResearchUK及其創新單位癌癥研究Horizons周一宣布,它們已達成一項合作協議,旨在探討共享技術、數據和見解,推動精準癌癥檢測和治療的發展。各方表示......

    <td id="wa4yw"><option id="wa4yw"></option></td>
  • <td id="wa4yw"><kbd id="wa4yw"></kbd></td><noscript id="wa4yw"><source id="wa4yw"></source></noscript>
    <bdo id="wa4yw"><kbd id="wa4yw"></kbd></bdo><input id="wa4yw"></input>
    <table id="wa4yw"><kbd id="wa4yw"></kbd></table>
  • <td id="wa4yw"><option id="wa4yw"></option></td>
    <option id="wa4yw"></option>
  • <table id="wa4yw"></table>
  • XVideos