中文詞彙網路2.0 | 中文詞彙
中文詞彙網路(Chinse Wordnet,CWN),是一項試圖解決詞義(sense)以及詞彙語意關係(lexical semantic relations)的語言知識資源。
中文詞網的核心元素 ...中文詞彙網路CWN2.0關於(About)查詢(Query)下載(Download)結束選單×關於(About)查詢(Query)下載(Download)12,753詞條34,422詞意12,620同義詞集47,450詞意關係關於中文詞彙網路CWN簡介相關人員研究發表CWN簡介中文詞彙網路(ChinseWordnet,CWN),是一項試圖解決詞義(sense)以及詞彙語意關係(lexicalsemanticrelations)的語言知識資源。
中文詞網的核心元素是中文詞彙的同義詞集(synsets)以及連繫各詞集的語意關係;透過語意關係,將各個同義詞集連接起來,形成語意網絡。
中文詞彙網路累積了近二十年的研究成果,起初由中研院語言學研究所推動,於2010年完成,目前中文詞彙網路由臺大語言所負責維護,並著力開發更廣泛且靈活的工具資源以供使用,例如:XML、SQLite格式、WordNetLMF資料格式等等。
中文詞彙網絡收錄範圍為實詞(openclass),亦即名詞、動詞、形容詞及副詞。
第一次使用中文詞網,可以參考新手教學、快速上手/小工具。
在數位人文的時代,附有標記的語料資料常是計算語言學與自然語言處理不可或缺的實用資源,更多語言的詞彙網路建立,也讓這項資源成為跨語言的研究素材。
架構WordNet中單詞之間的主要關係是同義詞,例如關閉和關閉或汽車與汽車之間的同義詞。
同義詞-表示相同概念並且在許多情況下可以互換的單詞-被分組為無序集合(同義詞集)。
WordNet的11.7萬個同義詞集中的每一個都通過少量的“概念關係”鏈接到其他同義詞集。
此外,同義詞集包含一個簡短定義(“光澤”),並且在大多數情況下,一個或多個簡短的句子說明了用法同義詞集成員。
具有多種不同含義的單詞形式以多種不同的同義詞集表示。
因此,WordNet中的每個形式含義對都是唯一的。
語意關係同義詞集之間最頻繁編碼的關係是超從屬關係(也稱為重名,下位或ISA關係)。
它將更通用的同義詞集(例如{furniture,piece_of_furniture})鏈接到越來越具體的同義詞集(例如{bed}和{bunkbed})。
因此,WordNet指出,家具類別包括床,而床又包括雙層床。
相反,床和束縛等概念構成了家具類別。
所有名詞層次最終都在根節點{entity}上。
假名關係是傳遞性的:如果扶手椅是一種椅子,而椅子是一種家具,那麼扶手椅是一種家具。
WordNet區分類型(通用名詞)和實例(特定人員,國家/地區和地理實體)。
因此,扶手椅是椅子的一種,巴拉克·奧巴馬(BarackObama)是總統的一個實例。
實例在其層次結構中始終是葉(終端)節點。
代名詞,{椅子}和{靠背,靠背},{seat}和{leg}等同義詞集之間存在整體關係。
零件是從上級繼承的:如果椅子有腿,那麼扶手椅也有腿。
零件不是“向上”繼承的,因為它們可能僅是特定種類的事物而不是整個類的特徵:椅子和各種椅子都具有腿,但並非所有家具都具有腿。
動詞同義詞集也按層次排列。
指向樹底的動詞(異義詞)表示事件的特徵越來越具體,例如{communicate}-{talk}-{whisper}。
具體表達方式取決於語義領域。
音量(如上面的示例中所示)只是一維,可以沿動詞闡述動詞。
其他的則是速度(慢跑)或情緒強烈(如愛偶像化)。
描述必要且單向涉及彼此的事件的動詞已鏈接:{購買}-{支付},{成功}-{嘗試},{顯示}-{see}等。
形容詞是根據反義詞來組織的。
成對的“直接”反義詞,例如乾濕的和年輕的,反映了其成員的強語義約束。
這些極性形容詞中的每一個又與許多“在語義上相似”的形容詞相關:幹與乾熱,乾旱,乾燥,乾燥,濕潤與濕潤,浸水等相關。
語義上相似的形容詞是“形容詞”的“間接反義詞”。
另一極的轉換部件。
關係形容詞(“pertainyms”)指向它們衍生自的名詞(犯罪犯罪)。
中文詞網的核心元素 ...中文詞彙網路CWN2.0關於(About)查詢(Query)下載(Download)結束選單×關於(About)查詢(Query)下載(Download)12,753詞條34,422詞意12,620同義詞集47,450詞意關係關於中文詞彙網路CWN簡介相關人員研究發表CWN簡介中文詞彙網路(ChinseWordnet,CWN),是一項試圖解決詞義(sense)以及詞彙語意關係(lexicalsemanticrelations)的語言知識資源。
中文詞網的核心元素是中文詞彙的同義詞集(synsets)以及連繫各詞集的語意關係;透過語意關係,將各個同義詞集連接起來,形成語意網絡。
中文詞彙網路累積了近二十年的研究成果,起初由中研院語言學研究所推動,於2010年完成,目前中文詞彙網路由臺大語言所負責維護,並著力開發更廣泛且靈活的工具資源以供使用,例如:XML、SQLite格式、WordNetLMF資料格式等等。
中文詞彙網絡收錄範圍為實詞(openclass),亦即名詞、動詞、形容詞及副詞。
第一次使用中文詞網,可以參考新手教學、快速上手/小工具。
在數位人文的時代,附有標記的語料資料常是計算語言學與自然語言處理不可或缺的實用資源,更多語言的詞彙網路建立,也讓這項資源成為跨語言的研究素材。
架構WordNet中單詞之間的主要關係是同義詞,例如關閉和關閉或汽車與汽車之間的同義詞。
同義詞-表示相同概念並且在許多情況下可以互換的單詞-被分組為無序集合(同義詞集)。
WordNet的11.7萬個同義詞集中的每一個都通過少量的“概念關係”鏈接到其他同義詞集。
此外,同義詞集包含一個簡短定義(“光澤”),並且在大多數情況下,一個或多個簡短的句子說明了用法同義詞集成員。
具有多種不同含義的單詞形式以多種不同的同義詞集表示。
因此,WordNet中的每個形式含義對都是唯一的。
語意關係同義詞集之間最頻繁編碼的關係是超從屬關係(也稱為重名,下位或ISA關係)。
它將更通用的同義詞集(例如{furniture,piece_of_furniture})鏈接到越來越具體的同義詞集(例如{bed}和{bunkbed})。
因此,WordNet指出,家具類別包括床,而床又包括雙層床。
相反,床和束縛等概念構成了家具類別。
所有名詞層次最終都在根節點{entity}上。
假名關係是傳遞性的:如果扶手椅是一種椅子,而椅子是一種家具,那麼扶手椅是一種家具。
WordNet區分類型(通用名詞)和實例(特定人員,國家/地區和地理實體)。
因此,扶手椅是椅子的一種,巴拉克·奧巴馬(BarackObama)是總統的一個實例。
實例在其層次結構中始終是葉(終端)節點。
代名詞,{椅子}和{靠背,靠背},{seat}和{leg}等同義詞集之間存在整體關係。
零件是從上級繼承的:如果椅子有腿,那麼扶手椅也有腿。
零件不是“向上”繼承的,因為它們可能僅是特定種類的事物而不是整個類的特徵:椅子和各種椅子都具有腿,但並非所有家具都具有腿。
動詞同義詞集也按層次排列。
指向樹底的動詞(異義詞)表示事件的特徵越來越具體,例如{communicate}-{talk}-{whisper}。
具體表達方式取決於語義領域。
音量(如上面的示例中所示)只是一維,可以沿動詞闡述動詞。
其他的則是速度(慢跑)或情緒強烈(如愛偶像化)。
描述必要且單向涉及彼此的事件的動詞已鏈接:{購買}-{支付},{成功}-{嘗試},{顯示}-{see}等。
形容詞是根據反義詞來組織的。
成對的“直接”反義詞,例如乾濕的和年輕的,反映了其成員的強語義約束。
這些極性形容詞中的每一個又與許多“在語義上相似”的形容詞相關:幹與乾熱,乾旱,乾燥,乾燥,濕潤與濕潤,浸水等相關。
語義上相似的形容詞是“形容詞”的“間接反義詞”。
另一極的轉換部件。
關係形容詞(“pertainyms”)指向它們衍生自的名詞(犯罪犯罪)。