| 选课类别:专业任务 | 教学语言:双语 |
| 课程类别:专业必修课 | 开课单位:统计与数据科学系 |
| 课程层次:本科 | 获得学分:3.0 |
关于老师&助教
李老师个人感觉教学上还是比较努力的,她尝试把一些重点知识拆开来给我们讲。大部分考试重点她应该也在下一节课复习上一节课的时候仔细讲解了,所以如果每一节课都能做到听懂的话,我觉得这门课相对来说还是算作难度适中的。但是不可否认的是,课程内容还是较多的,这门课同时也被称作“统计方法概论及其R语言实现”,这也就导致想要跟上老师可能需要每一节课听完以后,下课再花费大量时间。所以我个人其实部分课是没有完全跟上的,导致说实话有些部分听的也不算特别明白,估计寒假还得补补。当然,这也有可能是因为我大二就学这个(再次劝告诸位,这门课我觉得对数统和线性模型的依赖还是太高了,如果要提前学也最好先学线性模型)。不建议逃课,但老师对逃课的同学抓的不严。助教的话就每次正常批改作业,挺负责的就是疑似比较忙会忘记一些事,所以有时需要多提醒多去问一下。
关于分数
这门课就是大作业+proj+期末。大作业就是每次大概3节课以后一定要搞明白这三章的内容,虽然可能依旧迷迷糊糊,但至少大体的代码以及一些结果要能阅读。个人建议把数学原理也弄明白,这个也是蛮重要的,但是作业并不要求。ai对这个的帮助算是比较有限,不太建议直接靠ai写代码,ai倒是可以作为辅助阅读老师讲义的用处。proj的话就是老师给数据集,然后组队2~4人,使用课上的方法以及其他一些方法来写一份分析报告。这学期大家都写的不少,所以讲得也不少,这方面我觉得大家应该不会互相给低分吧(老师给了合格的报告就要给80底线,我个人是给了每一个合格组90+的,个人感觉没必要给特别低),老师那边也说靠这个拉总评分防止挂科。这个可以用ai,但是需要对自己写的内容的原理、以及为什么需要使用这个方法去分析有所理解,这样才能够作为合格的报告,有一组直接被老师骂了,就是因为这个原因。关于期末就是对平时内容的数学原理,代码、结果、专业名词四个方向来解读,允许1张cp,感觉重点在lm,annova这方面,虽然确实全是课内的内容,但说实话我感觉确实有不太会的内容,期末还没出,希望可以拿到不错的成绩。
关于课程
课程就是讲解一些统计方法,主要内容感觉就是假设检验,lm,annova,pca,决策树,分布和一些plot之类的,课程内容不算少,还是需要认真学一点的。
这门课反正我感觉也很难评价吧,就是说他课程内容感觉确实不少,需要对各种统计方法有不少的了解,老师的讲解也尽力了但是没办法我基础还是太薄弱了一点,反而对于R的需求感觉比较低,本质上你换个代码感觉影响也不大。虽然考察内容中规中矩,但是在这个课程内容量的基础下,我个人感觉也不算特别简单。总评老师是不捞的,argue就是老师重批而不是你过去argue那种,成绩出的比较慢,所以就先评价了吧,希望老师能给一个不错的成绩。附一个去年的成绩表,今年的估计下学期老师会给大家看。

附:感觉给分比我想象中的好,作为一名大二上这课的同学,感觉能超过去年平均分还是很好了,所以评分还是加一分,但依旧建议后来者不要大二上这个。
本人上这门课的时候是一名大三统计系本科生。这是一门本科生课程,而且应该是统计学作专业必修课,虽然名字花里胡哨,其实本质上就是一门R语言课程。总的来说,这门课如果是必修那你肯定是要学的,如果后面打算做点统计相关的科研也值得学,毕竟科研上很多做统计的人也还是在用R语言,业界上用Python更多,所以把这门课当作一门R语言的入门课其实也很不错,而且这门课其实压力也不大。
这门课的内容其实还是蛮多的,但是确实很大一部分就是在教学如何用R语言实现一些统计系其他理论课上学到的相关知识。具体比较重要的内容有:如何generate指定分布的数据,一些常见的统计Test如何使用,ANOVA+MANOVA,常见的条件树,RF,SVM还有一些clustering相关的包。老师在教学的过程中会讲解一些数学知识相关的部分,可以借此来复习一些以前学的知识,然后再进行代码教学,时不时会布置一些课堂任务让大家尝试(不强制完成)。班里应该还是有同学听课的吗,但是也有不少没在听课的,所以老师很多时候问问题也往往得不到回复,也还蛮可怜的。
这门课的作业基本都是R语言代码作业,难度没有非常大,但是作业的绩点占比还蛮大的,印象中还是会扣一点分的。根据身边同学反馈,这门课最大的难点在于用的R语言,但是不少同学用GPT写作业也是足以完成任务的。此外这门课在最后一个月还会有一个小组Project,自行组队选题,记得是老师会给一些data让大家尝试去做一些analysis,不会具体要求做啥,评分分为两部分,一部分是小组互评,一部分是老师自己评分,project扣分是这门课绩点扣分的大块,主要原因是大家的分普遍好像都没很高,应该是老师有意在控制,印象中最高的组在project上总评也会扣到1+。好消息是,这个project其实比较简单,个人认为只要把课上教的方法都尝试一下,串成一条线,再稍微加一点自己的想法就足以做的很不错了。因此整个学期下来这门课的压力其实不大。
这门课有一次期末考,这应该也是这门课被吐槽的最多的一点了。先讲一下分数吧,印象中这学期期末考最高分应该是86左右,没有90+的选手。期末考允许带一面的CP,写的多小老师也不会管你,但是这门课期末考的覆盖内容其实真的还是蛮多且蛮细致的,这门课上课用的不是PPT,更像是老师总结的精华版课本,一个Chapter大概都会有20面左右。试卷最开始会考几道手写代码题,但是其实都是一些比较基础的内容(相比于当年的JAVA A,应该就是现在的计程,本人感觉已经非常友好了)。然后就是基本上每章都考一道大题左右,题目会有很多小问,所以总体题量还蛮大的。其次就是问题问的都比较细致,和平时做的代码作业的题目有点区别,所以常常怕踩不到得分点而写出一大串相关内容,导致本人试卷和政治答卷一样写的很满,除此之外,其实题目本身难度并没有很大,基本都是一些基础知识,但是题目确实比较细。
印象中在第一节课老师就给大家展示了往年的绩点分布,这门课挂科很难,除非你真的乱来,但是90+或者说A-及以上的人数会比较少,印象中没有A+选手,但是这门课拿个85+好像还是比较容易的,因为作业拿高分比较容易,project基本上也没有太低的,期末占比也没有很高,所以也不容易拿太差的绩点,但是冲高分还是有一点困难的。
总结一下,这门课总体来说还是不错的,最起码个人不觉得是一门浪费时间的课程,学到的R语言相关的知识对于本人后续的“科研”工作也产生了一定的帮助,或者说也导致本人现在只会用R,Python一窍不通(做ML的同学还是一定要好好学Python!)。但是最起码这门课可以让你在学R的同时复习一下基础统计知识(让你保研面试或者外申面试前稍微熟悉一下知识点)那也还是蛮不错的。
很多内容和线性模型重复,好好学线性模型可以保证你这门课的成绩不太差,还有一些ML的基础内容。然后除去这些收获实在有限,这些东西也在别的课学了,还有期末的前面手写代码难评