机器学习⼊门科普篇--系列⼀
机器学习综述
机器学习是⼀门既“古⽼”⼜“新兴”的计算机科学技术,⾪属于⼈⼯⾃能(Artificial Intelligence)研究与应⽤的分⽀。
夏侯惇技能那什么是⼈⼯智能呢?
图灵在1950年发表的论⽂《Computing Machinery and Intelligence》中提出了“图灵测试”(Turing Test),⽤来判断⼀台计算机是否达到具备⼈⼯⾃能的标准。
机器学习系统特点
1
机器学习解决的问题都是⽆法直接使⽤固定规则或者流程代码完成的问题,通常这类问题对⼈类来说很简单。例如,我们⼈类可以⾮常容易从⼀张照⽚中区分出⼈和猫,⽽机器确⾮常难做到。
僵硬的近义词2
所谓具有学习能⼒的程序都是指它能够不断的从经理和数据中吸取经验教训,从⽽应对未来的预测任务。习惯称这种对未知的预测能⼒叫做泛化⼒(Generalization)。
3
机器学习系统更加厉害的地⽅是,它具备不断改善⾃⾝对应具体任务的能⼒。习惯称这种完成任务的能⼒为性能(Performance)。
杨茂贤机器学习的定义
如果⼀个程序在使⽤既有的经验(E)执⾏某类任务(T)的过程中被认定为是“具有学习能⼒的“,那么它⼀定需要展现出:利⽤现有的经验(E),不断改善其完成既定任务(T)的性能(P)的特质。
前端面试自我介绍
机器学习的任务分类
机器学习任务种类有很多,最经典且⼯业界应⽤最多的就是:监督学习(Supervid Learning)和⽆监督学习(Unsupervid Learning)。t5000
监督学习关注对事物未知表现的预测,⼀般包括分类问题(Classification)和回归问题(Regression)。
⽆监督学习则倾向于对事物本⾝特性的分析,常⽤的技术包括数据降维(Dimensionality Reduction)和聚类问题(Clustering)等。
分类问题
顾名思义,分类既是对其所在的类别进⾏预测。类别既是离散的,同时也是预先知道数量的。⽐如,根据⼀个⼈的⾝⾼、体重和三围等数据,预测其性别;性别不仅是离散的(男,⼥),同时也是预先知晓数量的。
回归问题
回归同样是预测问题,只是预测的⽬标往往是连续变量。⽐如,根据房屋的⾯积、地理位置、建筑年代等进⾏预售价格的预测,销售价格就是⼀个连续变量。
降维问题
数据降维是对事物的特征进⾏压缩和筛选。如果没有特定领域的知识,是⽆法预先确定采样哪些数据的;⽐如⼈脸识别,我们可以获取到图像的像素信息。若直接使⽤这些信息,维度会⾮常⾼,因此可以利⽤数据降维对图像进⾏降维,保留具有区分度的像素组合。
聚类问题
聚类则是依赖数据的相似性,把相似的数据样本划分为⼀个簇。不同于分类问题,⼤多数情况下不会预先知道簇的数量和每个簇的具体含义。现实⽣活中,⼤型电⼦商务⽹站经常对⽤户的信息和购买习惯进⾏聚类分析,⼀旦找到数量不菲并且背景相似的客户群,就是针对他们的兴趣投放⼴告和促销信息。
机器学习想要⼊门,仅仅这个科普是不够的,后续还会推出⼀系列DL⽂章,不仅仅是给⼩⽩兔的科普,也希望可以对于⼊门已久但是仍对机器学习不能⾃成体系的⼈⼀些帮助。越是接触的久了,学的多了就越应该谦虚虔诚的前⾏,希望⼀路都能看到您前⾏的⾝影。
参考⽂献:
Python机器学习及实践
机器学习
英语作文邀请信推荐阅读:
长沙特色美食小吃(上)
周泊霖
(下)