2020年实训或毕设可选的题目
1. 面向法律领域的知识图谱构建
- 建议实训、毕设(本题目与法学院师生讨论)
- 内容:基于特定领域的法律条文,构建法律知识图谱
- 可能涉及到的技术:爬虫、自然语言处理技术等
2. 面向软件缺陷领域的知识图谱构建
- 建议实训、毕设
- 内容:基于开源软件缺陷数据库,构建缺陷知识图谱
- 可能涉及到的技术:知识图谱构建、软件缺陷、bugzilla、句法成分分析、CRF(条件随机场),及其他相关自然语言处理技术等。
3. 软件缺陷分类
- 建议实训、毕设
- 内容:利用机器学习方法,对开源软件缺陷数据库中的缺陷进行分类
- 可能涉及到的技术:软件缺陷、bugzilla、机器学习、自然语言处理
4. 语音识别后端的文本检错纠错处理
- 建议实训、毕设(本题目有企业真实数据)
- 内容:语音识别过程将输入的语音信号转换成文本后,因为识别准确率不能实现100%,需要利用自然语言技术对文本错误进行自动检测和纠错,进一步提升识别准确率。
- 可能涉及到的技术:机器学习、自然语言处理。
5. 面向语音识别技术的训练集最小化方法
- 建议实训、毕设(本题目有企业真实数据)
- 基于机器学习的语音识别技术需要较多的语音数据作为训练集,而语音数据的采集成本高昂。如何规划训练集筛选方案,实现最小的训练集成本得到最大的训练模型性能提升?
- 可能涉及到的技术:机器学习、自然语言处理。
6. 语音数据采集APP或小程序或公众号开发
- 建议实训、毕设
- 基于科大讯飞或百度AI开放语音识别接口实现一个采集用户语音的APP,功能包括:1)用户注册与管理(可关联用户微信号);2)按照特定规则为用户提供文本,用户据此进行朗读和录音;基于语音识别接口对用户录音进行文字转录,进而根据转录文本的准确率给用户语音评分,低于一定阈值为无效录音,高于一定阈值则认为有效录音,可上传到服务器;3)后台记录用户基本信息和录音工作信息,并将对应信息存储到数据库;4)设计一套基于录音工作量和录音质量的计费规则,根据该规则,定期为用户支付红包。
7. Android ART研究
- 建议毕设
- 内容:Android ART是决定Android APP性能的关键环节之一,其中融合了包括编译器、解释器、垃圾回收等在内的多种功能和优化,可选择其一研究功能的实现及相关优化方法;进而提出和实现改善的方法。
- 可能涉及的技术:编译、垃圾回收、虚拟机、Linux系统。
8. 面向持久化存储的优化方法
- 建议毕设
- 内容:持久化存储是指通过将掉电不丢失的存储介质NVM当初内存来使用,这样,当进行程序间通信或者程序多次运行时,存储在NVM上的内存数据结构(比如graph、tree等)不需要涉及代价高昂的序列化和反序列化操作,后面的进程可以直接方法内存数据结构。可以提出编译层、运行时、操作系统层(比如文件系统)的实现方法,可选择其一。
- 可能涉及的技术:存储(体系结构)、编译器、运行时、操作系统。
实训或毕设要求
- 对所选方向感兴趣、积极主动地探索
- 保证实训(或毕设)要求投入的时间和工作量
- 在线讨论的话,保证每周至少讨论两次,至少提交一份简报
- 原则上,每个题目建议一人选择(如果两人组队选择,请陈述理由、提前商量好分工并申报);相关题目可以互相交流讨论。
简报格式要求
- 本周进展:请条列清楚,不少于100字
- 本周遇到的困难:如果有,请条列清楚,不少于50字;如果无,可省略
- 下周计划:请条列清楚,不少于50字