top of page

对外汉语:用AI解决中文可理解性输入内容

很多学习中文的朋友经常遇到的问题是很难找到适合他们水平和兴趣的输入内容。虽然网上有大量原版著作,中文网络文章和儿童绘本,但是都不适合初级和中级水平的习得者。我们以为儿童故事绘本应该是很好的学习中文内容,但是几乎所有的中文绘本都是给母语儿童启蒙的故事画册。我有很多和我语言交换的语伴,也曾经试着用那些现成的中文儿童绘本帮助他们学习,但是效果都不乐观。


一个核心问题:市场上的绝大多数中文内容在编写的适合没有充分考虑外语习得者的词汇范围,语法熟悉度,文化背景和其学习习惯。近几年很多中文教学实践者意识到了这个问题,亚马逊开始屡陆陆续续出现《中文分级读物,Chinese Graded Reader》。这是一个好的趋势,但是在大语音模型人工智能出现前,编写这类内容需要作者对中文分级标准和对标习得者的文化背景和习得习惯都要有较深刻的认识,往往做不到。于是出现了大量的原版故事略加修饰,比如增加拼音,解释语法点,介绍文化背景和配上英语翻译和练习题等。


要解决这个痛点,必须在词汇范围和重复性这两点入手。有经验的内容创作者可以独立完成这两点,但可能是个费时费力的过程。人工智能在这方面可以应用。


我和几个朋友决定解决这个痛点。利用人工智能有条件内容生成和输出方式可调整的特点产生不同风格,话题但是词汇范围和重复表达严格控制的可理解性输入输入阅读和听力内容。


不到一年的时间,我们生产出近三十本覆盖初学者,中级水平和高级水平共七十万字的中文分级读物。读物以独立故事书和在线阅读方式供读者选择。读者可以在《学语文》(www.learnyuwen.org)网站在线阅读,聆听和做练习,也可以下载PDF线下学习。


内容是通过Chat GPT的系列prompt完成的。指令主要体现下面几个方面:


  1. 严格控制水平,比如HSK 3, 单词库 600 汉字。

  2. 故事情节:这个需要创意,结合读者的西方文化背景或者参考经典流传的故事。

  3. 生词重复性:每个故事都不可避免或者有意引入一些常用高频生词,这类生词需要在故事情节中反复出现,加深读者印象和记忆。


在美国一些高中(公立和私立)外语课程和海外中文学校(Heritage Chinese)我们进行了一些试点,另外我的语伴也给我大量的反馈,证明在可理解性方面是有效的。


 
 
 

Commentaires


© 2024 -2025   Learn Yuwen. All Rights Reserved.

bottom of page