英语写作的“苦”,AI能帮你尝?

这个世界上有多少人在学习英文?

根据德国知名语言学家乌尔里希·阿蒙(Ulrich Ammon)的估计,答案是15亿,是学习法语,汉语,西班牙语,德语,意大利语和日语人数总和的10倍左右。

具体到中国,抛去全球互联网上80%的信息,60%的广播节目,75%的电视节目都是英文的宏观背景不谈,一代代学生被英文“折磨”的最直接原因是考试,在升学的推动下,英语已经是数代中国学生的必修课。

而众所周知,在“听说读写”这四大英文核心要素中,最考验英文综合能力的“写”,无疑“折磨”学生最多。无论是中小学英语考试,四六级,还是国际标准化测试,那些不易觉察的语法问题,不易调配的“高级”词汇,都是横亘在学生与一篇“漂亮”作文面前的绊脚石。

想要踢开这些绊脚石,除了日趋高昂的私教钱,很多学生都缺少一个贴身的作文老师。而在另一边,对于在校任教的英文老师而言,考虑到现在一个学生的课业负担,需要逐句批改的作文量也已堪称卷帙浩繁,这往往会让负责任的老师苦不堪言。

事实上,这也是为什么去年年底,当得知微软亚洲研究院推出微软“爱写作”网页版时,许多学生,家长,和老师都倍感欣喜的原因,“爱写作”在语法批改和评估反馈等方面的技术帮衬,委实令他们感到轻松许多。

而就在几天前,“爱写作”手机端也已正式上线,更便捷的批改与写作,让人能更好地用碎片化时间完成学习,且与网页端一样,从语法,用词,到文章结构;从中小学,四六级,到雅思托福,它能根据不同年级和类型的作文标准,有针对性地匹配反馈建议,帮助不同学习者提升英文写作水平。

1

事实上,基于微软亚洲研究院在自然语言处理和OCR(光学字符识别)等领域的研究成果,加之微软小英多年以来的技术积淀,针对英文写作的不同痛点,“爱写作”逐渐探索出了不同亮点。

依我之见,其中应用最广泛的是语法检查功能。

你或许知道,人类语言学一个最经典的命题就是:语言限定了人类思维的边界。就像哲学家维特根斯坦所言,由于每个人都是在语言的边界内写作与思辨,很难觉察到语言工具的局限。譬如终身只用汉语写作的人通常不会意识到,汉语中没有主宾格和单复数等逻辑信息,所以斯坦福大学教授雷拉·波洛狄特斯基(Lera Boroditsky)才说:“每种语言都包含着一种独特的世界观,反映了使用者数千年来的思想,倾向和认知方式。”

这种“思想,倾向和认知方式”,许多时候会让语法成为英文写作的最大障碍。例如时态等语法错误,倘若只是日常聊天,有点错没啥大不了,但当文字落于纸上,还是不出错为好。

让学生避免语法错误,也是“爱写作”首先想要解决的。“爱写作”在快速完成全文语法检查的同时,会将提交作文中的语法问题用红色下划线标记出来,学生点击红线,就可获得有针对性的语法讲解,且还能看到修改后作为参考的正确表达。

在英文写作中,比“正确”更难的,是“高级”。

这就要说到“爱写作”的另一项重要功能:词语替换。

有个著名的段子。家长问老师:“我家孩子4岁,英语词汇量大概只有1500个左右,是不是不太够?”。老师回答:“在美国肯定够了,在海淀区肯定不够。”

这个段子当然充满了中国式家长的焦虑,但你得承认,从英文的角度,掌握更多单词确实能丰富描述同一事物的维度,在日常练习中,老师也确实经常会问:“还有没有更高级的词可以用在这里?”

因为许多时候,仅仅是替换一个单词,就会生出一种赏心悦目的高级感(我相信看过《绿皮书》的人会对此深有体会),只可惜有些中国学生背了不少单词,却不能在最该用的时候信手拈来,这也极大影响了作文的美感。

针对于此,微软“爱写作”的词语替换功能,可以根据上下文筛选出多个高级词汇供你选择使用,譬如让你不再只会用“good”和“nice”这种简单词汇,而是能看到诸如“impressive”和“admirable”这种更高级复杂的词汇进行替换。

嗯,作为一个专业的中文写作者,我当然知道,有些时候“直抒胸臆”是最好的表达,但也有些时候,“岂曰无衣,与子同袍”会因更具美感而更具力量。

最后,再来简单了解下“爱写作”的分类作文打分和手写图片识别功能。

打分功能不仅能对所有文章进行一般性评分,还能测试同一篇作文在不同考试类型中的得分状况,因为不同的考试在词汇语法,文章结构和切题程度等方面有着不同的考量标准,所以“爱写作”在给出分数的同时,还可有针对性地评价一篇作文在不同方面的表现,并给出反馈建议。

而手写图片识别功能,能让学生只需用手机给作文拍照上传,就可将其转换成可用智能终端编辑的文字,语法检查,作文打分,词语替换等批改功能也可全部实现。你可以想见,除了方便学生,老师也可借助此功能,轻松识别学生们各不相同的手写字体,让作文批改工作事半功倍。

为了测试上述功能,我找了一篇手写英文段落,下面就是手写稿和系统自动识别的对比,不难发现,除了仅有的一个单词错误(your 识别成 year),以及需要把标题归到标题栏,识别结果非常完美,你可以直接编辑修改。

而完成编辑后,点击“批改”,系统会让你选择级别,我选了初中,批改结果如下。

可以发现,我选的这篇文章“十分优秀”只有一个语法错误,用红线标注,建议改为is——但为了锦上添花,系统给出了词语替换的建议(蓝线标注词语,这点真的很好用)。另外,点击“详细报告”,系统还会从文章流畅度和文章内容两方面提供建议。

最后值得一提的是,上述功能不但会持续得到优化,且“爱写作”同一账号手机端和网页端数据是打通的,用户可以在PC端练习写作,在手机端更方便地查看检索,完成英文写作的全场景覆盖。

2

不难发现,对于学习者而言,“爱写作”让英文写作训练变得更简单,而在这种简单背后,蕴含着微软自身AI技术的深厚积淀。

很多人知道,在AI辅助英语学习领域,微软亚洲研究院有着多年的经验:2009年就发布英库词典(必应词典的前身);2016年发布英语学习助手微软小英;2018年将“作文打分”功能嵌入微软小英。

而“爱写作”也经历了很长的研究阶段。如今,研究员在不断对自然语言处理等AI领域的算法模型进行迭代后,终于让其成为提升英语写作能力的利器。

以语法检查功能为例,其采用了微软亚洲研究院全新的学习和推断机制Fluency Boost Learning and Inference(流畅度提升学习与推断),帮助用户“找茬”。通过 Fluency Boost Learning(流畅度提升学习)生成的大量纠错数据,结合 seq2seq 预训练技术,语法纠错模型在 CoNLL-2014 和 JFLEG 两个权威语法纠错数据集上都率先超越了人类参考水平,并且持续保持着业界领先的技术水准。

再比如,在词语替换功能中,研发人员提出了基于预训练语言模型的词替换方法,并结合微软原创的预训练语言模型——UniLM作为词替换的解决方案。该方法通过半遮盖(partial masking)等策略让预训练语言模型能够同时考虑原目标词词义以及上下文语境,从而选出合适的替换词。

我知道,普通读者很难理解这些复杂的技术名词——你只需要知道,正是这些“复杂”,酝酿出用户练习英文写作时的简单。

另外你要知道的是,微软亚洲研究院是一个计算机技术的研究机构,而非一个“教育机构”,这也意味着,他们打造“爱写作”的目的,不是向市场推出一个“教育产品”去赚钱(顺便一提,微软小英自2016年推出至今都是免费的),而是通过与不同领域机构(尤其教育领域)的充分合作,更好地理解教育行业和用户痛点,探寻AI技术在教育行业的广阔可能。

核心就是两个字:赋能。“爱写作”是在以技术为长板,以场景为核心,赋能合作伙伴,让其掌握最新的技术工具,在AI时代发现新机遇,最终双方再共同赋能用户,解决中国英语写作学习者在移动和AI时代的需求。

事实上,“爱写作”的这种角色,很容易令人想到微软赋予自身的使命:通过提供平台和生产力工具,赋能地球上的每个人和每家组织,帮助他们取得更多成就。

结语

我一直说,判断一款产品优良的方法从来不拘一格,但有种方法深得我心,即它是否具备“若我年轻时就有它,该有多好”的属性,这种产品通常出现在教育领域。

是啊,包括我在内,无数中国学生经历过学习英语的煎熬,每个人学习英文写作的过程,也都像是一部“血泪史”,因为事实就像海明威说的那样:“写作没什么秘诀,你要做的只是在打字机前流血。”

对于中国的英文写作学习者来说,这句话仍然是对的,提高写作能力没有捷径,没人能绕开平日枯燥的大量练习——但如今,新技术的加持,至少可以在你“流血”时,少一些痛苦,多一些回报。

“若我年轻时就有它,该有多好”。