找回密码
 立即注册

QQ登录

只需一步,快速开始

机器学习资料整理【内有福利】 加入本站QQ交流群 本站落实实名发帖政策的通知
本帖最后由 小玩家 于 2018-1-10 11:38 编辑 由北京图象图形学学会主办的第十三届图像图形技术与应用学术会
该方向有什么好作
本帖最后由 北北 于 2017-12-21 16:11 编辑 参加了老大的自然语言处理课程,收获颇
链接:http://pan.baidu.com/s/1mhPOXs8 密码:3uzd
TensorFlow官方文档—中文版 链接:https://pan.ba
该教程将通过知识点讲解+答疑指导相结合的方式,让大家循序渐进的了解深度学习模型并通过实操演示掌握相关框架及TensorFlow工
本帖最后由 周天 于 2018-1-2
最最经典的
机器学习算法需要作用于数据,而数据的本质则决定了应
RT
505 链接:https://pan.baidu.com/s/1nwDa2VJ 密码:371b
504 链接:https://pan.baidu.com/s/1dFZvlap 密码:htvm
为什么要从自然语言处理入门机器学习: 机器学习必须和具体的数据类型、应用场景结合。由于文本
链接:https://pan.baidu.com/s/1b7t48A 密码:p06Y
链接: https://pan.baidu.com/s/1qYBej2s 密
链接: https://pan.baidu.com/s/1qXD5NEO 密码: e47u
优达学院面试技能三件套,包括找工作策略、模拟面试、拓展人脉三门课程
编者按:2017年是不平凡的一年(当然,事实上,每一年都是;P)
查看: 468|回复: 18

《从自然语言处理入门机器学习》[回帖奖励10金币]

[复制链接]
回帖奖励 9860 金币 回复本帖可获得 10 金币奖励! 每人限 3 次

190

主题

337

帖子

2万

积分

管理员

积分
24443
发表于 2018-2-6 11:19:16 | 显示全部楼层 |阅读模式
为什么要从自然语言处理入门机器学习:
    机器学习必须和具体的数据类型、应用场景结合。由于文本数据处理相对于语音和视频 图像要容易一点,加上互联网累积的文本数据是最丰富的,因此,目前超过半数的机器学习工程师都在做自然语言处理。

《从自然语言处理入门机器学习》 系列精品课程第II期
开课背景:
为了帮助零基础的学员系统性地学习机器学习,成为BAT的机器学习工程师,特开设本课程。
一门来自BAT讲师团队的机器学习课程,讲师来自百度、阿里巴巴等。

课程说明:
1)每一章安排授课时间2课时
2)讲师课后答疑,助教督促学员完成作业
3)本课程以实践为主轴,打通概念的讲述,但并非纯实战课程,而是理论体系比较完备、又注重实战的课程
课纲1.png

【初级班】
课程目标
能够完成基于朴素贝叶斯的、逻辑回归的中文垃圾短信识别,掌握分词、NLP各种工具包、常见的linux命令,理解线性回归、逻辑回归、朴素贝叶斯、最大熵、BP神经网络等基本模型
课程说明:
文本的特征表示、模型评估问题,会在实战过程中介绍
适合学员:
        对自然语言处理零基础、刚接触机器学习的学员
课程安排:
第一章:机器学习与自然语言处理基础
机器学习基本概念(有监督、无监督、分类、聚类、回归等)
自然语言处理简介
Python基础
jieba分词
Linux基本命令
轻松一刻:聊聊行业大师
第二章:自然语言的特征表示与语言模型简介
文本的特征表示:词袋特征、tf-idf特征、ngram特征、词粒度等
主题模型、词嵌入简介
统计语言模型
【实战】基于语言模型的乱序句子重建实验
第三章:线性回归和梯度下降
线性回归模型
梯度下降法(BGD/SGD/online GD)
过拟合、正则化
数据抽样算法
【实战】实现线性回归模型,预测波士顿地区房价(手写,不掉包)
【实战】实现线性回归模型,预测波士顿地区房价(掉包实现)     
第四章:逻辑回归模型与二分类实践  
      Logistic函数的由来、在神经网络中的应用   
逻辑回归模型原理与训练
广义线性模型
     【实战】实现基于逻辑回归的垃圾短信分类(手写,不掉包)
Python工具包介绍(numpy scipy sklearn)
     【实战】实现基于逻辑回归的垃圾短信分类(掉包实现)
     初级班期中考试
第五章:最大熵模型原理与应用
      信息熵系列概念介绍
      交叉熵与神经网络的评估方法
      最大熵模型
最大熵模型在NLP中的应用
第六章:朴素贝叶斯模型理论与实战
贝叶斯概率论基础
朴素贝叶斯模型
朴素贝叶斯模型在NLP中的应用
      【实战】基于朴素贝叶斯的垃圾短信分类(手写,不掉包)
      【练习】完成基于朴素贝叶斯的kaggle影评数据情感分析
第七章:神经网络基础与初探
      神经网络基本概念
      浅层神经网络
      深度神经网络简介
      【实战】基于MLP神经网络的垃圾短信分类
第八章:习题课与实战
      【习题课】讲解一些关于基本概念的题目      
      【实战】使用初级班所学模型,解决酒店评论情感分析问题      
深度学习简介与在NLP中的应用介绍
      下次课程预告
      初级班结业考试
学习资料:
统计自然语言处理基础
统计学习方法

【中级班】
课程目标
能够完成基于更高级特征、其他传统机器学习模型、更丰富的NLP工具和模型训练工具完成中文垃圾短信识别,特征包括“字粒度vs词粒度、词袋vs词嵌入、主题模型vs word2vec”,传统机器学习模型包括knn、svm、决策树、gbdt,NLP工具包括fasttext、glovec、word2vec、spacy、textblob,模型训练工具包括xgboost、libsvm、liblinear、weka、sklearn、lightgbm。
适合学员:
已修完初级班的学员
课程说明:
中级课程仍然仅限于传统机器学习模型,不会涉及到深度学习模型
相较于初级课程,中级课程内容比较饱满,课后还需要多加练习巩固。
课程安排:
第一章机器学习模型进阶(上)
KNN
SVM
sklearn高级功能介绍
【实战】在sklearn下调包,分别用KNN和SVM解决mnist分类问题,并评估
第二章:机器学习模型进阶(下)
决策树模型
模型融合(bagging/boosting)
随机森林
GBDT
【实战】在sklearn环境下,基于ngram和随机森林的垃圾短信分类
第三章:主题模型
     LSA
     PLSA
     LDA
【实战】主题模型在垃圾短信分类中的应用
第四章:词嵌入
Distributed representation的理论原理
Word2vec与Gensim
Glovec
Fasttext
【实战】基于fasttext的垃圾短信分类
第五章:模型训练工具介绍与实操
Weka
Xgboost
Libsvm
Liblinear
Sklearn(前面已经介绍过,这里为了体系完整性,提一下)
lightgbm
【实战】在libsvm环境下,基于ngram和svm的垃圾短信分类
第六章:垃圾短信分类进一步实战与各种方法效果对比
    【实战】基于ngram和GBDT模型的垃圾短信分类
     各种方法效果的对比与小节
第七章:企业实战模拟
    【实战】在训练语料无标注的条件下,如何基于规则来做垃圾短信分类
第八章:
【习题课】讲解一些关于基本概念的题目
    文本分类问题一般流程的总结
    下次课程预告

【高级班】
课程目标
    基于深度学习和tensorflow的自然语言处理。会介绍tensorflow的使用、深度学习的理论、以及深度学习在自然语音处理中的应用
第一章:深层神经网络简介
        深度学习简介
        基本概念:激活函数 dropout 交叉熵等
第二章:Tensorflow基本概念和架构
        Tensor  graph op session等基本概念
Tensorflow源码结构 master-worker模式等
第三章:Tensorflow第一步
        【代码解析】基于tensorflow的手写数字识别(mnist)         
第四章:CNN与自然语言处理
CNN原理
CNN处理文本分类的过程
第五章:CNN文本分类实战
【代码解析】Tensorflow实例讲解:“Kaggle San Francisco Crime Description”数据集
【实战】基于cnn的垃圾短信分类
第六章:RNN与自然语言处理
RNN原理
LSTM/GRU
RNN在自然语言处理中的应用
第七章:RNN文本分类实战
【代码解析】Tensorflow实例讲解
【实战】基于rnn的垃圾短信分类
普通RNN vs lstm  vs gru
单向  vs  双向
第八章:构建基于tensorflow serving的实时服务
        tensorflow serving简介
        【实战】使用tensorflow serving搭建手写数字识别实时服务(mnist)
        【实战】打造基于Tensorflow serving和双向GRU的垃圾短信识别实时服务

课程咨询:
这么饱满的课程内容,怎么报名呢?
     快来联系一下咨询老师吧 :



回复 论坛版权

使用道具 举报

0

主题

8

帖子

23

积分

普通会员

积分
23
发表于 2018-2-7 08:56:36 | 显示全部楼层

回帖奖励 +10 金币

了解一下
回复

使用道具 举报

0

主题

8

帖子

23

积分

普通会员

积分
23
发表于 2018-2-7 08:56:54 | 显示全部楼层

了解一下
回复

使用道具 举报

0

主题

8

帖子

23

积分

普通会员

积分
23
发表于 2018-2-7 08:57:35 | 显示全部楼层

了解一下
回复 支持 反对

使用道具 举报

0

主题

27

帖子

1298

积分

中级会员

积分
1298
发表于 2018-2-8 14:27:25 | 显示全部楼层

回帖奖励 +10 金币

这是要开培训班吗
回复 支持 反对

使用道具 举报

190

主题

337

帖子

2万

积分

管理员

积分
24443
 楼主| 发表于 2018-2-8 22:53:44 | 显示全部楼层
youmo81 发表于 2018-2-8 14:27
这是要开培训班吗

是的哦
回复 支持 反对

使用道具 举报

0

主题

15

帖子

648

积分

初级会员

积分
648
发表于 2018-2-9 16:16:58 | 显示全部楼层

回帖奖励 +10 金币

看着还不错呀
回复 支持 反对

使用道具 举报

0

主题

15

帖子

648

积分

初级会员

积分
648
发表于 2018-2-9 16:17:18 | 显示全部楼层

回帖奖励 +10 金币

什么时候开课
回复 支持 反对

使用道具 举报

0

主题

15

帖子

648

积分

初级会员

积分
648
发表于 2018-2-9 16:19:11 | 显示全部楼层

回帖奖励 +10 金币

回复

使用道具 举报

0

主题

3

帖子

84

积分

普通会员

积分
84
发表于 2018-2-10 17:38:52 | 显示全部楼层

回帖奖励 +10 金币

了解一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|申请友链|小黑屋|手机版|人工智能A7论坛(aqinet.cn) ( 沪ICP备15039134号-1 ) 人工智能A7论坛坛友会

GMT+8, 2018-2-20 11:55 , Processed in 0.082934 second(s), 50 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表