
原标题:清华考研辅导班-清华大学伯克利学院数据科学和信息技术-考研经验考研真题
本文主要为大家介绍清华大学清华-伯克利深圳学院数据科学和信息技术专业初试专业目录、参考书、复试分数线、真题以及初试经验等几部分的内容,不过由于20的分数线还未公布,所以分数线以19或往年为基础,作为参考,希望对同学们起到一定的帮助。
1、院系介绍
清华-伯克利深圳学院由清华大学与美国伯克利加州大学于2014年9月7日签署合作协议共同创建,面向全球共同面临的重大科技问题和社会持续健康发展问题,联合高等学院、政府和企业界开展跨学科学术研究和人才培养。学院将探索“大学-政府-企业”三方合作的培养模式,整合高校、政府和产业界的资源,建立一个国际化的人才培养与研究平台。
2、招生数据
2.1 专业目录
清华大学2020年硕士研究生招生专业目录
学院代码及名称:600 清华-伯克利深圳学院
专业代码及名称:0812J3 数据科学和信息技术
专业拟招收人数:22人
考试科目:
①101 思想政治理论②201 英语 一③301数学一
④961物理-化学方向基础综合 或 962 数学-数据方向基础综合
2.2 考试参考书
961物理-化学方向基础综合
《大学物理(第3版)》 清华大学出版社 朱峰
962 数学-数据方向基础综合
《数据结构》(C语言版) 清华大学出版社 严蔚敏、吴伟民
2.3 真题
关于真题部分,一般考完就封挡存放,学校也一般不会随意泄露出来,而网上的大家也不能随意相信,所以如果真的有需要的同学,可以跟班学习,譬如独峰考研这边都会提供内部资料以及相关真题的剖析讲解。
2.4 2019年复试分数线
总分:310
单科(=100):50
单科(>100):80
3、经验分享
距离初试结束已经过去了半个月之久,现在应邀来给大家写点我的复习经验,希望能对大家起到一定的帮助。
我考的是清华大学伯克利数据科学和信息技术专业,专业课是962 数学-数据方向基础综合
1、英语
英语是很重要的学科,不单单是初试那么简单,清华的复试还是很看重英语成绩的。所以从现在开始就得准备起来了。单词可以看朱伟的《恋练有词》,记好笔记每天复习。长难句和作文建议看何凯文的资料,有时间可以多看几遍。另外如果有精力每天练练口语,口语的材料可以用真题的阅读,口语好的同学,在复试里很抢手,而且还可以培养语感,练习阅读。英语没什么捷径和方法,还是要靠平时更多的练习,但是所有题目的练习一定要在规定时间内完成。
2、数学
高数的学习中,我个人的推荐是,先粗读一遍课本,不会的跳过即可,实在读不下去就不用读,然后配合辅导资料,配合着学一遍,我看的张宇的资料。这时候要把课后习题做了,这时候课后习题不一定全做,不会做的看答案即可,努力看懂,我相信你看完资料之后,大部分课后题即使做不出,答案也能看得懂,我个人复习的比较晚四月份开始,上册第一遍看完的时候大约到六月这边,学习不努力,所以看的比较慢。我的建议是,上册看完之后,就再去看上册的强化资料,上下册分开学,不要一遍学完上下册再回头看,那样遗忘的比较多。这时候,老师会带着你做一些有点难度的习题跟考研题,同学们,考研的题并不是都难的,所以不要害怕,有很多送分题的。这时候,你要做一些市面上的题了,我的推荐是:巩固基础的时候做课后题,强化的时候做市面上的题(我做过一些,我推荐强化阶段做汤家凤的1800,或者张宇一千题A组,李永乐的660有些难度,可以放一放)。强化的时候,一定要努力学透,题目可以不会做,但课本一定要吃透,因为题型千变万化,你可能没见过,但是当你学会考点的时候,早晚都会做,只是个阅历问题。所以我尤其推崇做题,考研数学也是个刷题的过程,我搜刮了一些题库,这里没法发文件,等会建个群我把文件共享在里面(只有数学类)。然后学完上册就学下册,下册比上册烧脑一些,所以要更努力,基础特别的重要,一定记得吃透定义。这时候应该会来到暑假里,我暑假没有回家,在这里学习,整个假期就是刷题,刷的也是自己找的题库。然后暑假也启动了线代概率的学习,因为当时觉得时间不够了,所以两门一起学的,在这里说一句,线代概率确实比高数学的快一些,时间也短一些,我高数上付出了巨大的时间,这么可能间接导致后面两门学起来轻松一些。
线代也是这么个流程,看课本,看资料,基础加强化,不过因为线代题型较少,分值占的少,所以学起来要快一些,但是线代的定义更多,并且不是很好理解,线代课程的关系是一脉相承,跟高数不一样,高数可能你上一章不会这一章会,但是你线代如果说上一章不会,那你后面的可能都不会了。这里推荐一本资料是李永乐的线代讲义,我做过张宇的,但是张宇的略难一些,看个人。资料也是看张宇的。你们可以挨个老师看看,喜欢哪个老师就看哪个,这个也是看个人。线代的学习可以说是三本中最简单的,但是计算量比较大,所以线代的题一定要动手做,因为线代的思路很简单,但是你不一定做对,就是因为计算能力不过关,他跟高数不一样,高数难的是思路,思路有了题目迎刃而解,可以说两门的学习方法是不一样的,因为高数考思路,所以你要海纳百川,多刷题长见识,线代是题型较少,题目千篇一律,但你不一定做对,这就要求你做的又仔细又快,所以在暑假就要把自己的计算能力提上来。
概率的学习,可以说跟高数的联系千丝万缕,我的概率是在暑假学的,我的概率资料看的张宇,然后觉得没看懂。又看了王式安的,讲道理,王式安的概率讲的比张宇好一些。概率的学习就不用课本了,因为课本相当复杂,这里我也建议买一本李永乐的概率讲义。概率的很多题型都是表面考概率实则考高数,这样他把两科结合起来,就看起来难一些,概率的题型相比之下变化也不算大,但是还是比线代难一些,概率还是重理解一些,不过概率常考的就是那一些,所以就多刷题,但是概率的题并不多,所以要精做,一定要学有所得。
3、政治
从暑假开始看书,没有报班也没有看视频。就是书和理解。一千题特别重要,尽量多刷几遍。后期用了石磊的风中劲草。这本书归纳的比较全面,没有肖那么繁琐,对后期记忆比较有帮助。然后就是政治框架特别重要,马原,史纲,毛特等板块一定要搞清楚。特别是马原那块。然后就是肖四肖八。考前重点记忆。政治吧,死记拿不了高分,要结合当今发生的时事,特别是中国发生的大事加以理解。其实仔细思考,你会发现马原很神奇,找到了乐趣,政治就没那么难了。
4、专业课
专业课962 数学-数据方向基础综合是今年新改的,原本是937数据科学基础综合,包含了运筹学、随机过程、数据结构等方面的知识,不过虽然名字改了,但是考试内容还是没什么变化。
运筹学和随机过程部分我推荐大家看看胡云权的书就行,这部分不难。
然后关于数据结构,这才是难点,尤其是对于跨考的同学。对于跨考的同学,我觉得如果有条件报个辅导班的一定要报,班推荐一个考研公众号考研臻选上的独峰,那儿都是志愿学校专业的学长学姐讲课,还有清北的学长学姐免费答疑,所以推荐给有意向的同学。毕竟考研不仅需要努力,也需要助力。对于自学的同学,那我也精心准备了一些数据结构复习的建议:
学习数据结构,如果时间上来得及,则可以看一遍C或C++,如果不够,那也不必因此而专门复习一遍C或C++程序设计,毕竟复习时间有限,而且数据结构要求的重点在于算法设计的能力,而不是编写代码的能力,因此,只要能用类似伪代码的形式把思路表达清楚就行,不用强求写出一个没有一点语法错误的程序。
下面我们来解析一下知识点:
线性表这一章里面的知识点不多,但要做到深刻理解,能够应用相关知识点解决实际问题。链表上插入、删除节点时的指针操作是选择题的一个常考点,诸如双向链表等一些相对复杂的链表上的操作也能出现在综合应用题当中的。
栈、队列和数组可以考查的知识点相比链表来说要多一些。最基本的,是栈与队列FILO和FIFO的特点。比如针对栈FILO的特点,进栈出栈序列的问题常出现在选择题中。其次,是栈和队列的顺序和链式存储结构,这里一个常考点是不同存储结构下栈顶指针、队首指针以及队尾指针的操作,特别是循环队列判满和判空的2种判断方法。再次,是特殊矩阵的压缩存储,这个考点复习的重点可以放在二维矩阵与一维数组相互转换时,下标的计算方法,比如与对角线平行的若干行上数据非零的矩阵存放在一维数组后,各个数据点相应的下标的计算。这一章可能的大题点,在于利用堆栈或队列的特性,将它们作为基础的数据结构,支持实际问题求解算法的设计,例如用栈解决递归问题,用队列解决图的遍历问题等等。
树和二叉树:这一章中我们从顺序式的数据结构,转向层次式的数据结构,要掌握树、二叉树的各种性质、树和二叉树的不同存储结构、森林、树和二叉树之间的转换、线索化二叉树、二叉树的应用(二叉排序树、平衡二叉树和Huffman树),重点要熟练掌握的,是森林、树以及二叉树的前中后三种遍历方式,要能进行相应的算法设计。这一部分是数据结构考题历来的重点和难点,复习时要特别关注。一些常见的选择题考点包括:满二叉树、完全二叉树节点数的计算,由树、二叉树的示意图给出相应的遍历序列,依据二叉树的遍历序列还原二叉树,线索化的实质,计算采用不同的方法线索化后二叉树剩余空指针域的个数,平衡二叉树的定义、性质、建立和四种调整算法以及回溯法相关的问题。常见的综合应用题考点包括:二叉树的遍历算法,遍历基础上针对二叉树的一些统计和操作(比如结点数统计、左右子树对换等等),判断某棵二叉树是否二叉排序树,以上这些都要求能用递归的和非递归的算法解决,特别要重视非递归的算法,线索化后二叉树的遍历算法,如查找某结点线索化后的前驱或后继结点的算法以及给出Huffman编码等等。
图:在这一章中需要识记的是图以及基于图的各种定义,存储方式。要熟练掌握图的深度遍历和广度遍历算法,这是用图来解决应用问题时常用的算法基础。需要掌握基于图的多个算法,能够以手工计算的方式在一个给定的图上执行特定的算法求解问题。常见的应用问题直接给出或经过抽象,会成为下列问题:最小生成树求解(PRIM算法和KRUSKAL算法,两种方法思想都很简单,但要注意不要混淆这两种方法),拓扑排序问题(这里会用到数组实现的链表,可以注意一下),关键路径问题(数据结构的较大难点,要把概念理解透,能做出表格找出关键路径),最短路径问题(有重要的应用背景,也是贪心法不多的能给出最优解的典型问题之一)。
查找:这一章,需要识记关键字、主关键字、次关键字的含义;静态查找与动态查找的含义及区别;平均查找长度ASL的概念念及在各种查找算法中的计算方法和计算结果,特别是一些典型结构的ASL值,B-树的概念和基本操作冲突解决办法的选择和冲突处理过程的描述,B+树的概念(新增考点),特别要注意B-树和B+树概念的对比,以及Hash表相关的概念。要熟练掌握顺序表、链表、二叉树上的查找方法,特别要注意顺序查找、二分查找的适用条件(比如链表上用二分查找就不合适)和算法复杂度。
排序:排序既是重点,又是难点。排序算法众多,各种不同算法还有相应的一些概念定义需要记住。选择题常见的问题包括:给定数列要求给出某种特定排序方法运行一轮后的排序结果,或者给出初始数列和一轮排序结果要求选择采用的排序算法,给定时间、空间复杂度要求以及数列特征要求选择正真适合的排序算法等等。如果排序这一考点出现在综合应用题中则常与数组结合来考查。
参考书建议我们大家用指定的清华严蔚民版,有助于建立知识体系,并且讲的比较通透。数据结构的复习要紧扣参考书,把书认真看几遍,深入理解大纲相关的知识点。
责任编辑: