Skip to content

基本术语 #1

@hhhparty

Description

@hhhparty

机器学习的基本术语

常见名词

  • Dataset数据集
    • D = {x1,x2,...,xm}是m个示例的数据集
  • Instance/sample
    • 每个示例xi是d维样本空间X的一个特征向量
  • Attribute value/feature
  • Attribute/feature space
  • Feature vector
  • training/learning
  • training sample
  • Label标记
  • example 样例( 拥有标记的示例)

机器学习的任务

  • Classification

    • 输出值或预测值为离散值
  • Regression

    • 输出值或预测值为连续值
  • Binary classfication

    • 输出值只有两个类型
  • Multi-Class classification

    • 输出结果由多个类型
  • clustering

    • 是将相似示例归为一组
  • Multi-labeling annotation

    • 分类任务的扩展
    • 对一个变量序列的输入,得到一个变量序列的输出。
    • 例如图像识别。

监督学习

学习的目的:学习一个由输入到输出的映射,称为模型。

模型的集合就是假设空间(hypothesis space)

模型:

  • 概率模型:条件概率分布P(Y|X)
  • 非概率模型:决策函数Y=f(X)

联合概率分布:假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions