返回課程列表
[BIEN3320]生物信息学概论
課程時間:2019年S季
授課教授:王吉光
我覺得教授:非常令人敬佩的计算生物学大牛,对于生物信息学领域有着非常强烈的热情
評分標準:attendance 10% + Individual Project (Report) 30% + Group Project (Presentation) 40% + midterm 20% (无Final)這門課的Grade:较好/一般
一门新课:BIEN3320/LIFS3320 Data Science for Biology and Medicine (3 units)
全程讲下来只是知道一个皮毛,很多东西没有深入讲。毕竟Computational Biology涉及的东西太多了,这个Introduction Level的课程也没法覆盖什么太多的东西。
两个project真的是做到天昏地暗。
第一个individual project就是分析一下肝癌死亡率和一些clinical data的数据,抄tuto的代码(然后改一改)就可以handle,我搞了一天从自学R语言开始到做出数据分析结果,然后瞎写了一篇report居然拿了全堂high??
第二个Group Project分析分子水平的数据和肝癌的死亡率的关系,占40%,15min课上pre3,随机分组三个人一组,本人真的完全不知所措,全程靠队友来exchange的土耳其大肌霸和 LIFS double CS 的韩国小姐姐carry(然后就“雨我无瓜”了orz),用了最后一周整个周末搞project其他什么事儿都没干,不过最后有above mean就还不错啦
Midterm开卷考试,让用电脑,30min,不是很难,考前过一遍ppt基本就能拿个mean了。所有人的差距都蛮小的。
没有final!!!!!(但是那两个project蛮要人命的
另外我真的想要吐槽一下prof的ppt,每页上真的没啥信息,要么就是简单列几点概念(这概念还经常没有定义让人难理解),要么就是贴两张分辨率堪忧的图,要么就是列一道内地小学生奥数题目。看起来非常费劲。复习midterm的时候试图去看ppt理解概念,盯着一张神经网络的图盯了半天都快看出神经质了,让自己有一种“脑子就是一团浆糊、我不配拥有正常的人类神经网络”的错觉。看着看着突然就看不懂了回去翻翻前面的ppt也没明白什么意思,最后全靠google自学。关键是这东西概念很多很杂,要想要真正的理解是需要一步一步来的,并不是一个简单的速成的东西。
然而另一点很头疼的就是prof上课并不能够讲清楚这些概念和算法,而且很致命的一点是一些基本概念他是默认你知道这大概是个什么东西的,所以他给的起点都相对很高,但是这个课里面有相当一部分是没有高级programming基础的LIFS和BIEN学生,对于data science基本是从零开始,所以一开始就可能听不懂在讲什么。Prof喜欢上课画一些板书来帮助解释问题,但是画得很乱而且思路太快经常不明白他在画什么。后面的Machine learning部分甚至都不是prof自己讲(请了lab里面的一个PhD讲了四节课,估计这老哥可能也没有看过prof之前讲了什么没有讲什么,经常不知道怎么回事就介绍了一个复杂的算法然后全班懵B,然后同样也有讲不清楚和板书看不懂的问题)。本来这个课就是一个introduction level的data science课,讲课起点偏高,而落点参差不齐,让人有一种“好不容易我终于听懂了结果你怎么才讲了这么一点啊”的不爽。不过这个是第一年的课可能有问题也都正常吧,至少在课上学了一点东西。
Prof讲课可能并不是他的长项,适应大陆口音英语也花了我蛮长时间的。不过Prof的研究非常前沿,和prof几次聊天能感觉到他有着最本真的研究热情和态度,就是因为人类需要和自己喜欢而做的科研,坚持下来做出的结果还是蛮厉害的,可以去prof的lab网站瞧瞧。实验团队有宣武医院的医生、码农、算法工程师、培养细胞的生物系大佬等等……对于癌症方面的研究前景很不错,实验室里面UG做UROP的同学也蛮多的~
下面一些其他吐槽:
1. Rm6602的椅子也太舒服了吧,配合着教授那平缓舒适的语音,每次去一定会睡着orz
2. 这门课的pre-requisite是(COMP 1021 OR COMP 1022P OR COMP 1022Q OR COMP 2011) AND (ISOM 2500 OR LIFS 3150 OR MATH 2411),不过建议会线性代数(至少MATH2111/MATH2350级别,最好能会decomposition),要不然clustering的一些算法machine learning的一些算法部分可能全程懵B不知道在说什么。另外建议懂一点点Python/R/Matlab要不然从零开始上手到能处理数据可能需要花费一些时间学习(google)。此外建议上ISOM2500的同学自己多学一点统计来应对这个课的难度(科大ISOM2500实在是太水了,这门课的概率统计部分的起点要比ISOM2500高一些。另外内容和COMP3711一些东西有重合,所以CS来上的童鞋们可能很舒服
3. 初学一门语言推荐一个网站叫datacamp(其他类似的网站也有),我的R就是在那自学的,有教程和及时的练习,刚开始用好像能免费学几个教程,对于初学者小白来说蛮友好
4. 个人感觉R语言在处理这些生物数据方面好像比Python稍微有一点优势(可能是因为我python烂吧)
Stats:
-Participation(10%):FULL MARK(去听80%的课就给满分)
-Midterm(20%):17/20(mean17.6,SD很小基本分不开差距)
-Individual Project(30%):27.5/30(mean25.7)
-Group Project(40%):33.79/40(mean32.3)
最后给了A-
个人不做任何上或者不上这门课的recommendation。后面spring sem开这门课可能会改一些内容和评分标准,大家还是客观理性分析一下为好。