目前哪些網站屬於語義網?


Tim Berners-Lee提出語義網概念的時候,想的是Web的延伸:Web中的信息不只是從一個page鏈接到另一個page,數據也是相連的,也就是linked data。具體來說就是,當機器認識Web資源中一個事物的時候,它作為一個類(class)的實例,其語義是通過其屬性(datatype property)以及它和其他實例的關係(object property)來被理解的。具體的實現方式為本體技術,歷史上有多種標準,現在比較流行的是w3c的owl。

在Tim Berners-Lee的最初藍本里,Web上存在的是linked data,通過xslt(或者其他技術)轉換成網頁。可惜語義網沒像當初Web一樣產生革命性的影響,也就是說,不太現實。

我們現在說語義網,更多的是指語義網相關的技術,最主要的,本體。本體其實是一種知識表示的方式,與dublin core等其他老牌元數據格式相比,owl/rdfs提供了基礎的語義,以及規範統一的語法。

不管採用那種知識表示方式,都可以支持『知識圖譜』等應用。owl的好處在於可以復用linked data上,尤其是wikipedia的延伸dbpedia上的資源。

可用的資源可以看Linked Data | Linked Data上列出的信息。

上面提到的Wolfram Alpha,以及很多問答網站,還有比如IBM Watson,都會用到語義網技術。

不過語義網技術更像是數據(信息)層面的,具體處理問題還要涉及一些NLP的工具。

如果本體用owl的話,本體查詢可以用sparql語言。加入NLP的模塊,可以把自然語言轉換成sparql查詢,比如這個http://sparql2nl.aksw.org/

DBPedia也有直接的選擇查詢方式,比如這個wiki.dbpedia.org : Online Access


廣義來講,谷歌等搜索引擎都引入了語義知識,典型應用如知識圖譜等,本質就是不再只把查詢詞當做字元串做匹配,而是將其所代表的語義信息考慮在內,量化計算。我覺得這方面的代表應該是 Wolfram Alpha,Wolfram|Alpha: Computational Knowledge Engine ,非常強大。


自薦:

楚辭 -- 讓知識融入你的生活/作品


我補充一個Facebook Graph Search吧!還有就是bing裡面有與facebook信息流的結合應該也算。其實國內的微軟小冰也算。


這個是一個在線的語義網的問答系統

The START Natural Language Question Answering System


推薦閱讀:

請教高手:我理解的語義網路是否正確?我想參加這方面的研究。
扯淡一詞的出處?
編譯原理語義分析階段,現在已經做到了能生成語法樹,基於語法樹怎樣實現語義分析和中間代碼生成?
不斷發展的語音識別和語義分析技術對互聯網世界會有怎樣的影響?它們更可能成為大公司屏蔽競爭對手的護城河還是創業者顛覆市場格局的殺手鐧?

TAG:人工智慧 | 語義網 | 網站 | 語音識別 | 語義分析 |