英语文章分词去重导入背词软件
为解决单词使用与背词不匹配的问题,将个人平时看到外文站点的文章 导入分析,输出单词数据可导入背词软件,通过第三方软件的艾宾浩斯遗忘曲线算法背词。
解决了什么
- 结合遗忘曲线重复洗脑记忆
- 完美解决背了不用的困境
- 文章时对应个人兴趣爱好去导入,如:编曲、情爱小说、bananas等
- 期望效果:分别对不同到领域,提取真正用到的单词
开发步骤分析
- 英语分词
- 检查拼写错误
- 去重、去复数、去时态,简单来说还原基本单词
- 去掉简单词汇,如:me、you、to
- 输出“单词数据”,如:有道云
技术:属于「自然语言处理」范畴,上游类别是「人工智能」
关键技术
- nltk 自然语言处理
- pandas 表单处理
下一步行动
由于找到更合适的移动端app(百词斩)来学习,项目将暂停开发。
分析一下app的好处
- 直接通过句子学习
- 单词翻牌为单词原型(区别于其他背词软件)
- 还有训练模型供快速复习