系統說明
Ⅰ 系統相關說明
1. 「中研院中文對話語音語料庫(TMC語料庫)」為43小時的中文對話語音資料,包含30個自由對話(MCDC8和MCDC22)、29個特定主題對話和26個地圖任務對話(MTCC和MMTC)。每個對話的平均時長分別為1小時、20分鐘及10分鐘。TMC 語料庫具備對話情境及對話夥伴是否熟識的平衡設計。 一共記錄了年齡在16歲至63歲之間的98名女性和72名男性語者語音資料。 其中有26位語者參加了所有三個子語料庫的錄音計畫。錄音時使用SONY TCD-D10 Pro II DAT 數位錄音機與Audio-Technica ATM 33a麥克風,48 kHz 的採樣率。錄音地點在中央研究院語言學研究所的安靜房間,個別語者以獨立聲道錄音。對話內容以繁體中文轉寫,口語對話中經常出現的語助詞、言談標記、填充詞等都轉寫時予以相應註釋。本檢索系統的拼音及詞類,僅MCDC8經過人工檢查,其餘語料庫皆為自動處理結果,請謹慎使用。
2.本系統中文口語語料庫主要為連續口語語料,包含成人對話語音、成人訪談語音、兒童複誦語音及兒童口述語音。連續語音會依據停頓和各種非語音聲音(例如呼吸、吸氣和笑聲)等線索,切割為interpause units (IPU)。
3.話語助詞的標記,在本系統語料庫中包括FILLER_FEEDBACK、MARKER、PARTICLE_M、PARTICLE_S,可透過POS選單搜尋。FILLER_FEEDBACK標記了語者在言說時發出的一些語氣聲音,以拼音字母表達,並無可表示的漢字對應字。MARKER用來做為話語標記(Discourse marker),如NA、NE、NA_GE、NE_GE,語者說話時或在思考間所發出的語助詞,並不同於限定詞(determiner)的「那」、「這」。PARTICLE_M及PARTICLE_S則分別標記了語者在言說時使用了台灣華語及閩南語來表示的語氣詞或表停頓,如「對A」、「HON」。
4.當語音轉記為文字時,一些無法清楚辨識的聲音或字詞,以標記「(uncertain) 」來處理。
5.當語者以閩南語言說時,並不轉記為漢字,標記為SOUTHERN_MIN。
Ⅱ 關鍵詞輸入
1.拼音之輸入,須輸入完整拼音及聲調才能正確找到符合拼音之漢字;檢索二個字以上則須輸入完整聲調才能顯示檢索結果。
2.拼音字與字之間,應輸入半形空白,或輸入半形下底線「_」。
[例]:
◇ 輸入拼音「zhen」檢索,拼音字母包含「zhen」者皆會被搜尋出來,包括「zhen1」、「zhen3」、「zheng3」等。
◇ 欲輸入拼音檢索「然後」,關鍵詞拼音應輸入「ran2_hou4」或「ran2 hou4」。
Ⅲ 檢索範圍設定
進入語料檢索頁面後,按下頁面左側「選擇語料庫」按鈕,側邊欄開啟後,可選擇欲檢索的語料範圍。本系統包含三個主語料庫:
一、中研院中文對話語音語料庫
二、中研院台灣華語社會語音語料庫
三、中研院兒童語音語料庫
主語料庫一次只能選擇一種,不可重複選取;主語料庫下之次語料庫可多項選取。選定後須按「確定」,方完成搜尋範圍設定。

Ⅳ 「中研院中文對話語音語料庫」檢索
一、選擇檢索範圍:點擊左方「選擇語料庫」,選擇「中研院中文對話語音語料庫」,並可打開該項下拉式選單勾選子語料庫。
二、設定語料檢索條件
1.設定主要關鍵詞,於第一條檢索欄位輸入欲檢索的主要關鍵詞(可輸入漢字或拼音),關鍵詞輸入後,可下拉詞類選單選擇詞類。
2.於主關鍵詞下再設定次要關鍵詞條件。
(1)選擇搜尋模式,包括:
a.同一個IPU內(同一語者):次要關鍵詞將會限定與主要關鍵詞在同一個IPU內。
b.前後相鄰n字內(同一語者):n可輸入1~20數值。檢索規則為限定與主關鍵詞為同一語者,並與主關鍵詞之左邊及右邊相鄰n字內,不受IPU限制。
c.前後相鄰n字內(不同語者):n可輸入1~20數值。檢索規則為限定與主關鍵詞為不同語者,並與主關鍵詞之左邊及右邊相鄰n字內,不受IPU限制。
(2)設定次要關鍵詞的檢索條件,包括:
a. 「AND」:次關鍵詞與主關鍵詞為and(和)之關係。檢索結果必須同時出現主要搜尋目標與次要搜尋目標。
b. 「OR」:次關鍵詞與主關鍵詞為or(或)之關係。 除了主要搜尋目標外,只要有符合的次要搜尋目標,也會顯示。
c. 「NOT」:次關鍵詞與主關鍵詞為not(不包含)之關係。主要搜尋目標的檢索結果中若出現次要搜尋目標,則該筆結果不顯示。
(3)次要關鍵詞條件設定欄可按主搜尋條件右方的「+」新增,或按次搜尋條件右方的「-」減少。次要關鍵詞條件設定二個以上時,檢索邏輯無關設定之先後次序,而是與主關鍵詞之條件關係為檢索原則。
三、檢索結果
(1)檢索結果以對話方式顯示。
(2)檢索之關鍵詞將予以反色,便於檢視。惟符合檢索關鍵詞但並不符合檢索條件之關鍵詞,亦可能會有反色的情況,使用者仍需自行辨別。
(3) 次條件搜尋模式選擇同一語者,原則上只有同一語者之關鍵詞予以反色,但仍可能出現檢索系統誤判之情況,致使不同語者出現之關鍵詞亦反色,使用者仍需自行辨別。
(4)檢索結果頁面,點擊「檔案編號」欄,可進入檢視更多語料內容(第二層檢索結果)。
(5)於檢索結果頁面右上方,點擊「檢視」,可進入檢視視窗查看關鍵詞出現處之語料。點擊「匯出」,可下載第二層檢索結果(前150筆)。
(6)「檢視」功能:
<1>進入檢視時,顯示之規則為先出現主關鍵詞之檢索結果條,再依次關鍵詞檢索順序分列各次關鍵詞檢索結果條。
<2>「檢視」功能提供依各關鍵詞左/右之相鄰字排序。排序順序先依前項說明之關鍵詞順序排序,再依左/右之相鄰字排序。
Ⅴ 「中研院台灣華語社會語音語料庫」檢索
一、選擇檢索範圍:點擊左方「選擇語料庫」,選擇「中研院台灣華語社會語音語料庫」。
二、設定語料檢索條件
1.設定主要關鍵詞,於第一條檢索欄位輸入欲檢索的主要關鍵詞(可輸入漢字或拼音)。
2.於主關鍵詞下再設定次要關鍵詞條件。
(1)選擇搜尋模式,包括:
a.同一個IPU內:次要關鍵詞將會限定與主要關鍵詞在同一個IPU內。
b.前後相鄰n字內:n可輸入1~20數值。檢索規則為限定與主關鍵詞為同一語者,並與主關鍵詞之左邊及右邊相鄰n字內,不受IPU限制。
(2)設定次要關鍵詞的檢索條件,包括:
a. 「AND」:次關鍵詞與主關鍵詞為and(和)之關係。檢索結果必須同時出現主要搜尋目標與次要搜尋目標。
b. 「OR」:次關鍵詞與主關鍵詞為or(或)之關係。 除了主要搜尋目標外,只要有符合的次要搜尋目標,也會顯示。
c. 「NOT」:次關鍵詞與主關鍵詞為not(不包含)之關係。主要搜尋目標的檢索結果中若出現次要搜尋目標,則該筆結果不顯示。
(3)次要關鍵詞條件設定欄可按主搜尋條件右方的「+」新增,或按次搜尋條件右方的「-」減少。次要關鍵詞條件設定二個以上時,檢索邏輯無關設定之先後次序,而是與主關鍵詞之條件關係為檢索原則。
三、檢索結果
(1)檢索之關鍵詞將予以反色,便於檢視。惟符合檢索關鍵詞但並不符合檢索條件之關鍵詞,亦可能會有反色的情況,使用者仍需自行辨別。
(2)檢索結果頁面,點擊「檔案編號」欄,可進入檢視更多語料內容(第二層檢索結果)。
(3)於檢索結果頁面右上方,點擊「檢視」,可進入檢視視窗查看關鍵詞出現處之語料。點擊「匯出」,可下載第二層檢索結果(前150筆)。
(4)「檢視」功能:
<1>進入檢視時,顯示之規則為先出現主關鍵詞之檢索結果條,再依次關鍵詞檢索順序分列各次關鍵詞檢索結果條。
<2>「檢視」功能提供依各關鍵詞左/右之相鄰字排序。排序順序先依前項說明之關鍵詞順序排序,再依左/右之相鄰字排序。
Ⅵ 「中研院兒童語音語料庫」檢索
一、選擇檢索範圍:點擊左方「選擇語料庫」,選擇「中研院兒童語音語料庫」,並可打開該項下拉式選單勾選子語料庫。
二、設定語料檢索條件
1.設定主要關鍵詞,於第一條檢索欄位輸入欲檢索的主要關鍵詞(可輸入漢字或拼音)。
2.於主關鍵詞下再設定次要關鍵詞條件。
(1)選擇搜尋模式,包括:
a.同一個IPU內:次要關鍵詞將會限定與主要關鍵詞在同一個IPU內。
b.前後相鄰n字內:n可輸入1~20數值。檢索規則為限定與主關鍵詞為同一語者,並與主關鍵詞之左邊及右邊相鄰n字內,不受IPU限制。
(2)設定次要關鍵詞的檢索條件,包括:
a. 「AND」:次關鍵詞與主關鍵詞為and(和)之關係。檢索結果必須同時出現主要搜尋目標與次要搜尋目標。
b. 「OR」:次關鍵詞與主關鍵詞為or(或)之關係。 除了主要搜尋目標外,只要有符合的次要搜尋目標,也會顯示。
c. 「NOT」:次關鍵詞與主關鍵詞為not(不包含)之關係。主要搜尋目標的檢索結果中若出現次要搜尋目標,則該筆結果不顯示。
(3)次要關鍵詞條件設定欄可按主搜尋條件右方的「+」新增,或按次搜尋條件右方的「-」減少。次要關鍵詞條件設定二個以上時,檢索邏輯無關設定之先後次序,而是與主關鍵詞之條件關係為檢索原則。
三、檢索結果
(1)檢索之關鍵詞將予以反色,便於檢視。惟符合檢索關鍵詞但並不符合檢索條件之關鍵詞,亦可能會有反色的情況,使用者仍需自行辨別。
(2)檢索結果頁面,點擊「檔案編號」欄,可進入檢視更多語料內容(第二層檢索結果)。
(3)於檢索結果頁面右上方,點擊「檢視」,可進入檢視視窗查看關鍵詞出現處之語料。點擊「匯出」,可下載第二層檢索結果(前150筆)。
(4)「檢視」功能:
<1>進入檢視時,顯示之規則為先出現主關鍵詞之檢索結果條,再依次關鍵詞檢索順序分列各次關鍵詞檢索結果條。
<2>「檢視」功能提供依各關鍵詞左/右之相鄰字排序。排序順序先依前項說明之關鍵詞順序排序,再依左/右之相鄰字排序。
1. 申請帳號,請進入新申請頁面下載申請書。
2. 申請書應完整填寫,並由任職或就讀單位核蓋單位印章。
3. 上傳已完成簽署之申請書檔案(.pdf)。上傳完成後,按下「預覽檔案」,即可以確認是否上傳成功。
4. 點擊「確認申請」,即完成帳號申請。
5. 申請書審核通過者,系統將發送登入帳號及密碼至申請人信箱,登入後即可開始使用本系統。
6. 帳號使用效期為一年。帳號到期後需重新提出申請。