| 选课类别:专业任务 | 教学语言:中文 |
| 课程类别:专业选修课 | 开课单位:统计与数据科学系 |
| 课程层次:研究生 | 获得学分:3.0 |
并不怎么语言学的nlp,不过好在目前nlp也基本不管语言学。好处是跟前沿结果跟得比较紧,至少学完这门课的时候,你收获的知识还没有脱节。
老师对于nlp大多数基础问题了解彻底,如果想走这个方向但是是小白,问就完了,能给你讲懂。前沿的问题就不用期待解答,可以期待探讨,这一点上大家起点都是一样的。
不建议有基础的人选这门课,上课80%内容还是基础,没必要为了20%的前沿去花两节课时间上课,不如花给读论文。又比如写报告的时候,你觉得理所当然、没必要写上去的东西(比如怎么用hf model,怎么用peft),助教会因为你没写而扣分,因为助教是默认大家都不会,所以要求你写详细,你没写那就是你不会,抱歉,扣你分了,哪怕你报告的内容足够彰显你真的全会。
课程的覆盖的内容很广 如果把它看作一门导论课来学会make sense很多
前两周主要介绍一些nlp的历史和背景 后来就是word embedding/transformers/pretraining/fine tuning/alignment/data sythesis/information retrieval以及一些agent和多模态的内容
陈老师会在ppt里会插一些比较新的论文里的内容 不过大部分都是一笔带过 想全弄明白需要画挺多时间的 但不妨碍即使纯听课也可以在这门课上有很多收获的
成绩结构:40% assignments/25% project/5% pre/30% finals
给分还是蛮好的 作业/project/pre 三大块儿70分好好做大概能拿个68 69 目测这门课A率远高于系里本科课程平均水平
课程覆盖的东西还是比较广的,感觉算是把大模型八股相关的内容过了一遍,期末复习复习的挺痛苦,考的英文卷子,看到简答题有点两眼一黑(真就只压中了几个),但是平时分给的真的很高,期末只考了八十多也干到A了。
东西我觉得还是学到了不少,但是感觉有些作业的难度其实是不低的。尤其是最后的Project,你想做精细一点就很多东西要做,不过好像最后给分给的很宽松,应该很多人的都给满了。就是这个课肯定得课后花时间,能学到东西,期末也算能速成吧,但是确实不太推荐基本没有什么Python或者机器学习深度学习基础的同学选。
老师答疑这块还是相当认真的,这个确实得给个好评,但是事情相对也比较多。
陈老师在答疑这块没得说,对教学也非常负责,就是无论是上课还是找他科研,你都免不了要做ppt,感觉他对ppt有特别的喜好…
外系选的anlp,不懂这门课为什么会放在统计与数科系,cgh的研究方向和数据分析有些关系,但课程内容就是纯几节传统nlp和intro to LLM,感觉CSE打头合理些…
LLM的部分也只是粗略介绍了下近些年的工作,因为只有理论课,代码部分都是当成拓展内容靠自己看,作业涉及的也少。本人期末缓考了,但看平时分给的还是不错的,project疑似完整做完就给满(25%),且cgh在考虑减少期末的比例(原30%),四次作业40%平均每次也能拿到9+/10,非常奈斯。不过,作为一门伪计系的课,还是建议想转码且想在风口蹭口饭吃的同学来选。