簡介 - 語料處理

中研院語言所建置的中文口語語料庫主要為連續口語語料,包含成人對話語音、成人訪談語音、兒童複誦語音及兒童口述語音。連續語音會依據停頓和各種非語音聲音(例如呼吸、吸氣和笑聲)等線索,切割為interpause units (IPU)。