在任何专业领域完成第二年学习的新生都被鼓励遵循以下提供的3+2加速课程, 如果他们有兴趣在五年内完成本科和研究生课程. 对该选项感兴趣的学生只有在进入网赌平台网站本科课程并表现出良好的学习成绩后才有资格. 这些申请人必须满足以下最低条件,才能通过3+2途径入学:

  • 完成2年学业,各项学术事业考核合格.
  • Complete prerequisite courses (see below)
  • Be recommended for the 3+2 pathway by a faculty member

Prerequisite Courses

以下课程必须在本科学习的前两年完成:

  • MATH 2400 – Calculus I
  • CSCI 2200 – Introduction to Programming in Python
  • MATH 2200 – Probability 1 (Mod 1)
  • MATH 2320 – Linear Algebra
  • STAN 2700 – Dealing with Data I (the section that uses an R)

The following courses are not required, but highly recommended to be taken by the end of the third semester:

  • CSCI 2400 – Object Oriented Programming
  • MATH 4550 – Probability 2 (Mod 2)
  • MATH 3250 – Calculus II

IDC 5204 -应用统计学I:一门统计学课程,侧重于描述和推断统计, with topics on linear regression, confidence intervals and hypothesis testing, including probability theory and modern approaches such as resampling, 使用R中说明的所有方法,并重点关注使用工业数据集的数据科学相关方法.

IDC 5110 -数据改造和探索性数据分析:重塑的实用方法课程, reorganizing, and summarizing relationships in data through exploratory analysis. Principles and methods for preprocessing, normalizing, and validating data are covered, with an emphasis on collaborative and reproducible research.

IDC 5120 -数据科学算法:算法和性能度量的基础. Taught in Python, 本课程包括对排序和检索数据的有效算法的探索, graph algorithms and combinatorial optimization, dynamic programming, randomized algorithms and approximation algorithms.

数据科学数据库:传统数据库设计和管理的基础知识. Various types and comparison of databases including SQL databases (eg. Postgre, SQLite), NoSQL databases, column-oriented databases (eg. HBase) and document-oriented databases (eg. MongoDb). 数据检索和存储的一致性、可用性、可扩展性、效率和性能.

IDC 5296 -工业研讨会系列I:第一次提供了一个长达三个学期的研讨会系列,邀请来自各种工业领域的专业人士和高管作为嘉宾演讲. 每周或每两周的研讨会通过各种数据科学技术的应用,涵盖主题和商业中各种问题的应用.

IDC 5295 -工业研讨会:本课程提供的内容模块是对应用数据科学研究生课程常规课程的补充. Examples include, but are not limited to, topics such as Ethics, emerging or trending techniques in data science, domain-specific applications, industrial software platforms or tools, 并且专业的认证模块和考试在业界得到广泛认可.

IDC 5205 – Applied Statistics II: A course on statistical modeling, including multiple linear and logistic regression, and more generally, generalized linear models. Emphasis is placed on model formulation, building, assumptions, interpretations, predictions and assessments, 并在R语言中实施,重点关注使用工业数据集的数据科学相关方法和模型.

IDC 5112 -数据可视化:一个以项目为中心的介绍,用于知识发现和结果交流的定量信息的可视化显示. Students develop, over the course of the semester, 他们感兴趣的可视化应用程序,其中包含从工业应用程序或项目中收集的数据.

IDC 5210 -应用机器学习:基于项目的课程,涵盖监督和无监督学习,重点是处理真实的工业数据. 贝叶斯分析和其他具体的学习范例,包括回归, clustering, random forests, support vector machines, kernel methods, and neural networks.

分布式计算:关于设计和维护大规模并行数据集的基础知识. Non-relational databases and their management. 并行架构算法和相关软件工具,包括MapReduce/Hadoop框架和BigTable.

IDC 5297 -工业研讨会系列II:为期三个学期的研讨会系列的第二个产品,主持来自各种工业领域的专业人士和高管作为嘉宾演讲. 每周或每两周的研讨会通过各种数据科学技术的应用,涵盖主题和商业中各种问题的应用.

IDC 6293 -工业实习I:作为暑期实习或期中应用项目, 本课程是为希望将数据科学知识和技能付诸实践的学生提供的第一个广泛的真实行业经验机会. 必须与项目的工业合作伙伴或学生选择合作的公司/组织一起完成, while under the supervision of a data science faculty.

IDC 6200 -高级应用统计:第二个统计建模课程, with a mix of topics such as generalized additive models, models for longitudinal responses, time series models, survival analysis, statistical learning or Bayesian statistics, with a focus on models relevant for data science. 以项目为重点,在应用业务环境中使用实际工业数据进行教学.

IDC 6215 – Advanced Applied Computing: Advanced topics in computing, including such topics as image processing and object detection, text mining, natural language processing, recurrent neural networks, reinforcement learning. 以项目为重点,在应用业务环境中使用实际工业数据进行教学.

IDC 6250 -实用数据科学:数据分析和数据科学管道的创建,并为行业交付. Working in small groups, 学生从探索性分析开始分析行业提交的数据集, followed by statistical or machine learning-based model building, 以及向行业合作伙伴构建和展示数据产品.

IDC 6298 -工业研讨会系列III:第三个也是最后一个长达三个学期的研讨会系列,主办专业人士和高管作为嘉宾演讲来自各种工业领域. 每周或每两周的研讨会通过各种数据科学技术的应用,涵盖主题和商业中各种问题的应用.

IDC 6294 -工业实习II:作为数据科学团队的一部分,在工业中工作一整个学期, 同时每周接受数据科学学院的监督并向其提交报告. 这是工业实习的第二阶段,也是最后阶段,学生在工业合作伙伴公司或组织或自己选择的公司工作. Performance is assessed both by a faculty advisor and a company supervisor.