「台湾客语语料库」数位化建置 机器人也可说客语

2020-04-20
[导读 ] 为了保存客家语言,客委会积极建置「台湾客语语料库」,完整蒐集珍贵的客家文字、声音,进行数位化,未来将做为学术研究、客语学习之用,甚至应用在人工智慧,与长照机器人对话。客家委员会主委李永得表示,客语过……
「台湾客语语料库」数位化建置 机器人也可说客语

为了保存客家语言,客委会积极建置「台湾客语语料库」,完整蒐集珍贵的客家文字、声音,进行数位化,未来将做为学术研究、客语学习之用,甚至应用在人工智慧,与长照机器人对话。

客家委员会主委李永得表示,客语过去只有口语对话,没有文字,若不好好整理,会随着语言的使用,及不断与外来语混用,而逐渐变化与消失,因此,客委会希望用现代科技,进行保存与转译,未来能利用AI,与其他语言同步对译,更希望导入手机的语音秘书,可随时多语对话。

「台湾客语语料库」目前已经蒐集书面语语料500万字、口语语料10万字,计画共同主持人政治大学传播学院副院长刘慧雯指出,客语语料库是目前最完整、最大量蒐集客语声音与文字语料的资料库,并透过完整系统架构储存,所以未来在AI应用上可能性非常大,而除了学术、教学之外,在长照机器人的使用上,都非常有潜力。

配合「国家语言发展法」上路,未来将建置国家语言资料库,客委会表示,「台湾客语语料库」将在民国111年上线, 届时将提供外界使用,有利于未来产製客语的各项加值服务。

上一篇: 下一篇: