Semi-supervised-learning
半监督学习
什么是半监督学习
半监督学习是 1.利用未标记样本的信息 提升学习器泛化性能 2. 不依赖外界信息交互的学习方法 (主动学习 依赖外界信息交互)
半监督学习如何利用未标记样本的信息: 分布假设
将未标记样本的所隐含的数据信息同类别标记相联系,也就是分布假设,通常有聚类假设,流行假设
- 聚类假设:假设数据存在簇结构,属于同一个簇的数据点 从属于同一个类别
流行假设:假设数据分布在流形结构上,相近的数据点拥有相似的输出值 可以看出流行假设比聚类假设应用范围更广,适用于更多的数据
这两种假设的本质都是: 相类似的数据拥有相类似的输出半监督学习类型的划分
- 纯半监督学习:假设训练数据中的未标记样本,并非待预测数据
- 直推学习: 假设训练数据中的未标记样本即为带预测数据
可见前者基于开放世界假设,后者基于封闭世界假设,对于前者来说,当新的数据来临,不必训练新的学习器,可以用于在线任务,而后者则不可以,当有新的数据需要预测时,需要训练新的学习器。
几种半监督学习的方法
本节摘录机器学习一书中的几种半监督学习方法,在未来的学习中,若遇到新的学习方法,会有增加
在hexo 中 输入公式
介绍 和 使用
著名的Stackoverflow网站上的漂亮公式,就是使用了MathJax插件的效果。添加MathJax插件也非常简单,只需要在markdown文件中,MathJax 的开关,如下:1
2
3
4
5
6---
title: index.html
date: 2016-12-28 21:01:30
tags:
mathjax: true
--
接下来 在 hexo 中 安装插件1
npm install hexo-math --save
修改 站点配置文件1
2
3
4
5
6
7
8
9plugins:
hexo-math
math:
engine: 'mathjax' # or 'katex'
mathjax:
# src: custom_mathjax_source
config:
# MathJax config
修改 主题的配置文件:1
2
3
4# MathJax Support
mathjax:
enable: true
per_page: true
修改mathjax.swig 文件 添加cdn 源
注意 网上的大多数教程 配置的cdn源都是 http的,如果 你的网站配置了 ssl 那么 http则会产生安全问题 这里我们配置 https的cdn1
cd \themes\next\layout\_third-party
找到 mathjax.swig 文件 修改如下:1
<script type="text/javascript" src="https://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS_HTML"></script>
配置行内公式写法:在mathjax.swig 修改如下1
2
3
4
5tex2jax: {
inlineMath: [ ['$','$'], ["\\(","\\)"] ],
processEscapes: true,
skipTags: ['script', 'noscript', 'style', 'textarea', 'pre', 'code']
}