• 难度
    进阶

    实习就业

  • 学习时间
    12月15日开班

    48小时

  • 课程价格

    早鸟价面授 $2900(截止日期12月7日),早鸟价远程 $2300(截止日期12月7日),原价$3200

  • 先修知识

    基础数学和计算机知识

    了解基本的数学知识

合作机构
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
我们的课程经过下面的企业认可
  • 匠人partner aws
  • 匠人partner amazon
  • 匠人partner microsoft
  • 匠人partner accenture
  • 匠人partner suncorp
  • 匠人partner pwc
  • 匠人partner myob
  • 匠人partner
  • 匠人partner rea
  • 匠人partner
  • 匠人partner
  • 匠人partner avanade
  • 匠人partner avanade
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner
  • 匠人partner

为什么选择IT匠人的数据科学基础班?

匠人推出的数据科学基础班旨在帮助学员在三个月的时间内从理论而实践全面提升能力,从0到1的学会数据抓取、模型构建、机器学习原理以及FinTech金融预测的基本知识,并进行实战搭建房价预测,图像识别,汇率预测与回测等APP。

课程目标

  • 了解澳洲数据科学行业背景,职业前景和职业发展方向
  • 学习数据抓取和搜集,如何从网站上抓取数据并进行分析
  • 学习AzureML以及简单预测模型的构建
  • 学习机器学习的基本原理,应对面试中的基础问题
  • 学习Python和SKLearn的基本概念与Backend的关联,应对面试中选择算法相关的问题
  • 学习深度学习以及其在图像识别中的应用
  • 掌握金融预测基本概念以及实际应用

匠人推出的数据科学基础课程组由清华学霸导师设计研发,能够有效帮助学员在三个月的时间内从理论到实践全面提升能力,为学员以后的自学提升及求职就业之路打下坚实基础。

features__images
  • 全面的课程设置

    理论基础 + 项目实战 + 常用工具

  • 顶尖导师团队

    匠人导师团队均为多年经验的IT大咖,每一个培训都是由各自专属领域的大牛授课,导师也是名校毕业和名企经验,从百度到阿里巴巴,从ThoughtWorks到Microsoft,Amazon,从Senior Developer到CTO,应有尽有。同时加入匠人圈,也是加入了IT匠人全球IT职业资源。

  • 丰富的项目经验

    数据抓取词频分析 + Azure ML搭建房价预测APP + CNN & Fullstack搭建图像识别APP + FinTech实战汇率预测

  • 模拟工作场景+团队协作

    面试中常问的如何团队协作,那我们在本培训中会有很好的解决,我们通过最流行的Agile项目管理方式,通过顶级Agile大师带领大家理解Agile的Methodology,真实的工作环境中如何使用agile,团队是如何协作的,如何进行代码管理,版本控制,怎样融合团队成员的代码,同时我们也会在每节课带领大家模拟公司的standup和retro等等

features__images

你将挑战的项目

Project

图像识别全栈Web APP

构建基于Angular 6+、ASP.NET CORE、TensorFlow、ProtoBuf等技术的Web全栈项目。通过这个项目你讲学习到如何写一个Angular前端App,如何搭建ASP.NET CORE的后端Web API服务,如何用ProtoBuf+Grpc进行通讯,如何用训练TensorFlow搭建和训练图像识别的深度神经网络。

Project

房价预测APP

AzureML API+前端框架搭建房价预测APP

学习用AzureML实现简单预测模型的构建 - 如何预测房价。从零开始学习AzureML图形化工具,学习AzureML在电影推荐、汇率预测、文本分析和图像分析等场景下的应用。利用AzureML 作为API简单结合前端框架(如Angular)搭建房价预测APP。

你将学到什么

Syllabus

数据科学基础班

项目

房价预测+汇率预测

SEE FEWER DETAILS

48小时

先修知识

这是一门进阶课程,你需要懂得最基本的HTML CSS和Javascript,并且理解变量,面向对象等基本编程概念。

  • 机器学习和人工智能数学基础

    微积分(重要极限、微分原理、积分、泰勒展开、常微分方程)

    用Mathematica推导微积分的原理、进行微积分计算、求解微分方程

    线性代数(向量、矩阵、向量和矩阵的运算和微分)

    利用Mathematica做线性代数计算和矩阵向量的微积分

    概率论与统计(概率概念、条件概率、概率分布、离散概率、连续概率、翁模型、正态分布、 χ2-分布、t-分布、f-分布、z-分布、ANOVA、 WoE等)

    用Mathematica进行离散数学计算、推导和计算概率和统计学分布、检验和ANOVA分析

    用Numpy做数值计算

    用TensorFlow处理数值、矩阵、向量、变量的 导数

    用SciPy做统计学计算和分析

  • AzureML数据处理和建模

    数据导入

    数据清洗

    分类器算法

    回归算法

    回测

    模型优选

    AzureML的模型发布和API整合

  • 机器学习算法原理

    DT(决策树)

    RF(随机森林)

    PCA(主成分分析)

    kNN(k-邻近)

    K-means(K-平均值)

    LR(逻辑回归)

    LDA(线性判别分析)/QDA(二次判别分析)

    SVM(支持向量机)/SVR(支持向量机回归)

    kernel methods(核方法)

    RIDGE(脊回归)/LASSO(套索回归)

    Ensemble Learning(集成学习)

    MLE(最大似然估计)和Linear Regression(线性 回归)

    MAP(最大后验估计)

    NBC(朴素贝叶斯分类器)

    Sk-Learn和SparkML当中机器学习算法的使用练习

  • 神经网络和深度学习原理

    神经网络的运算原理和训练方法

  • Data Scraping

    利用HTML、API和Selenium抓取数据的方法: .Net Core, Selenium WebDriver, ChromeDriver, Ubuntu Linux。

    利用HttpClient访问网页和调用Web API

    用Regular Expression直接抓取

    利用HtmlAgilityPack解析HTML并抓取数据

    利用NewtonSoft.JSON解析抓取JSON数据

    利用Selenium Chrome Driver浏览器自动 +HtmlAgilityPack化抓取复杂网页的数据

    Selenium和Chrome在Ubuntu Linux上的部署

    爬虫在Windows和Ubuntu Linux上的部署

  • 前端开发(Angular, TypeScript, JavaScript, NodeJS, VS Code)

    Angular开发环境的配置

    VS Code的插件和使用

    利用TypeScript编写Angular的Component、 Pipe、Service、Singleton Service

    Router和RouterOutlet的使用以及多RouterOutlet的导航规则

  • 后端开发和数据库使用

    ASP.Net MVC, Visual Studio, Ubuntu Linux

    Asp.Net Core MVC开发环境的配置

    Asp.Net Core MVC的后端逻辑分层规则

    数据库访问PostgreSQL关系型数据库和统计分 析查询、ArangoDB图数据库的使用、MongoDB 文档数据库的使用

    Asp.Net Core MVC与Angular前端的整合

    发布Asp.Net Core与Angular全栈项目到 Windows(Windows服务配置和Task Scheduler) 和Linux VM(Ubuntu Linux的服务配置和Crontab)

  • 跨语言整合(ProtoBuf, Grpc)

    ProtoBuf和Grpc在Visual Studio当中的编写和整合

    利用ProtoBuf编写跨语言服务协议

    在Asp.Net Core当中通过ProtoBuf调用Python机器学习服务

  • Python与机器学习、深度学习

    Python, AnaConda, SK-Learn, TensorFlow, Numpy, OpenCV 实现前端、后端到深度学习的全栈-深度学习整合

    Python和AnaConda开发环境与Visual Studio的配置和整合

    神经网络的数学原理(数值优化、链式法 则、正反向传递)

    神经网络应用和技术前沿的介绍

    利用TensorFlow构造简单的神经网络

    利用TensorFlow和OpenCV实现深度卷积图像 识别的训练与预测

    Asp.Net Core与TensorFlow图像识别服务通过 ProtoBuf的整合

    发布全栈-深度学习到Windows和Linux

  • 大数据工程

    IntelliJ IDEA, Spark, Spark SQL, Scala, SBT, Parquet, Spark MapReduce原理

    MapReduce和Spark的原理

    IntelliJ IDEA开发环境和Spark的SBT配置

    利用SBT直接编译并在Linux上运行Spark

    Scala的基本语法

    CSV文件、Parquet文件的读取和导出

    利用Spark编写并行算法的练习

    SparkSQL与DataFrame的使用

    通过DataBricks集群使用Spark

  • 源代码管理

    GitHub, VSTS源代码管理将渗透到具体的每个项目当中

    在GitHub和VSTS上创建repo

    多人合作Repo的权限管理

    Git Flow(Git开发流程)、创建分支、Pull Request、代码审核、合并

  • 云存储与Serverless

    云存储与Serverless服务在大数据与数据科学 工业方案当中的应用

    Azure Blob Storage的使用

    Azure Functions的开发配置

    用Asp.Net Core编写ETL(数据转化导出)工 程(SFTP的使用、数据格式的转化)

我们的老师

Gucheng Zhu
Gucheng Zhu

Data Engineer

早年留学澳洲,蹉跎中练出一身本领。10年本地工作经验,非常熟悉澳洲市场(Tier1 – Tier 3)的需求。拥有良好的技术、业务与交际能力,经常被上层委派指导Junior。现任澳洲知名银行大数据工程师,目前专注于企业级Big Data, GDW 2.0和数据科学产品的开发与整合。
Power BI
CBA
数据科学
数据工程师
10年经验