NotePublic/Software/Applications/Octave/Octave_基本操作.md

891 lines
18 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# [Octave 基本操作](https://www.cnblogs.com/zhxuxu/p/9473385.html#%E5%87%BD%E6%95%B0)
在学习机器学习的过程中,免不了要跟 MATLAB、Octave 打交道,这两个工具都可以帮助我们很好的解决数值计算问题,两者的语法也非常接近。
Octave 是一个完全开源免费的软件,无论是 Windows 还是 Mac 环境都可以在官网下载安装包直接安装,非常方便。
这篇文章主要介绍在学习机器学习的过程中会经常使用到的 Octave 的一些命令和语法。当然,一篇文章肯定无法覆盖 Octave 的所有功能,但是对于我们入门机器学习应该足够了。
## 1.基本计算
Octave 中的 加、减、乘、除运算:
```m
>> 2 + 2
ans = 4
>> 3 - 2
ans = 1
>> 5 * 8
ans = 40
>> 1 / 2
ans = 0.50000
```
同时也可以进行平方、立方等指数运算:
```m
>> 2^2
ans = 4
>> 2^3
ans = 8
```
在 Octave 中,我们可以使用符号 % 来进行注解其后面的同行语句都将不会得到执行。例如2+3 %+5 输出的结果为 5。如果你熟悉 java 语言,可以类比为 //,或者是 Python 中的#。
## 2.逻辑运算
常用的逻辑运算包括:等于(==)、不等于(~=)、并(&&)、或(||)四种,分别用不同的符号表示。
运算的结果用 0、1 表示1 表示成立0 表示不成立。
```m
>> 1 == 2
ans = 0
>> 1 == 1
ans = 1
>> 1 ~= 2
ans = 1
>> 1 && 0
ans = 0
>> 1 || 0
ans = 1
```
在 Octave 中,同时还内置了一些函数来进行逻辑运算,比如异或运算就可以用 xor 这个函数来代替:
```m
>> xor(3, 1)
ans = 0
>> xor(3, 3)
ans = 0
>> xor(1, 0)
ans = 1
```
在 Octave 中内置了很多的函数有时我们可能记不太清某个函数的具体用法这个时候Octave 给我们提供了 help 命令,通过这个命令可以查看函数的定义以及示例。比如,我们想看下 xor 这个函数怎么用可以输入help xor。
## 3.变量
同其他编程语言一样,我们也可以在 Octave 中定义变量,语法跟其他语言也比较类似:
```m
>> a = 3
a = 3
>> a = 3;
>>
```
上面的例子中,我们定义了变量 a并将它赋值为 3。
有一个细节需要我们注意的是:在第一次执行 a = 3 的后面没有加;号Octave 在执行完赋值语句后又打印出了变量 a 的值。而在第二句中,我们在赋值语句的末尾添加了;号这个时候Octave 只会执行赋值语句,将不再打印变量值。
除了将数值赋给一个变量,我们也可以将字符串、常量赋给变量:
```m
>> b = 'hi'; % 因为加了;号,没有打印出 b 的值
>> b % 直接输入变量名称,即可打印变量值
b = hi
>> c = (3 >= 1)
c = 1
>> a = pi;
>> a
a = 3.1416
```
在上面的第二行语句直接输入了变量名称没有分号Octave 直接打印出了变量的值。
除此以外,也可以使用 disp 函数来完成打印变量值的功能:
```m
>> disp(a)
3.1416
```
结合 printf 函数,还能实现格式化打印。还是以上面的变量 a 为例:
```m
>> disp(sprintf('2 decimals: %0.2f', a))
2 decimals: 3.14
>> disp(sprintf('6 decimals: %0.6f', a))
6 decimals: 3.141593
```
printf 函数沿用了 C 语言的语法格式,所以如果你有学习过 C 语言的话,对上面的写法应该会比较熟悉。
除了使用 printf 外,利用 format long、format short 也可以指定打印的精度,在 Octave 中short 是默认的精度:
```m
octave:32> format long
octave:33> a
a = 3.14159265358979
octave:34> format short
octave:35> a
a = 3.1416
```
## 4.向量和矩阵
### 4.1.向量 / 矩阵的生成
在 Octave 中可以这样定义矩阵:将矩阵的元素按行依次排列,并用[]包裹,矩阵的每一行用;分割。
下面定义了一个 3×2 的矩阵 A
```m
>> A = [1 2; 3 4; 5 6]
A =
1 2
3 4
5 6
```
说明:; 号在这里的作用可以看做是换行符,也就是生成矩阵的下一行。
在命令行下,也可以将矩阵的每一行分开来写:
```m
>> A = [1 2;
> 3 4;
> 5 6]
A =
1 2
3 4
5 6
```
向量的创建与矩阵类似:
```m
>> V1 = [1 2 3]
V1 =
1 2 3
>> V2 = [1; 2; 3]
V2 =
1
2
3
```
在上面的例子中V1 是一个行向量V2 是一个列向量。
其他一些写法:
```m
>> V = 1: 0.2: 2
V =
1.0000 1.2000 1.4000 1.6000 1.8000 2.0000
```
上面的写法可以快速生成行向量1 为起始值0.2 为每次递增值2 为结束值,我们也可以省略 0.2,那么就会生成递增为 1 的行向量:
```m
>> v = 1:5
v =
1 2 3 4 5
```
同样,我们也可以利用 Octave 内置的函数来生成矩阵,比较常用的几个函数是 ones、zeros、rand、eye。
ones(m, n) 函数生成一个 m 行 n 列的矩阵,矩阵中每个元的值为 1。
zeros(m, n) 函数生成一个 m 行 n 列的矩阵,矩阵中每个元的值为 0。
rand(m, n) 函数生成一个 m 行 n 列的矩阵,矩阵的每个元是 0 到 1 之间的一个随机数。
eye(m) 函数生成一个大小为 m 的单位矩阵。
```m
>> ones(2, 3)
ans =
1 1 1
1 1 1
>> w = zeros(1, 3)
w =
0 0 0
>> w = rand(1, 3)
w =
0.19402 0.23458 0.49843
>> eye(4)
ans =
Diagonal Matrix
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
```
### 4.2.向量 / 矩阵的属性
在说明矩阵的属性操作之前,我们先来定义一个矩阵 A
```m
>> A
A =
1 2
3 4
5 6
```
矩阵有了,怎么知道一个矩阵的大小呢?在 Octave 中,内置了 size 函数。
size 函数返回的结果也是一个矩阵,但这个矩阵的大小是 1×2这个 1×2 的矩阵中,两个元素的值分别代表了参数矩阵的行数和列数。
```m
>> sa = size(A);
>> sa
sa =
3 2
>> size(sa)
ans =
1 2
```
当然,我们也可以只获取矩阵的行数或列数,使用的同样是 size 函数,唯一不同的是需要多指定一个参数,来标识想获取的是行还是列,这个标识用 1 或 2 来表示1 代表想获取的是行数2 代表想获取的是列数:
```m
>> size(A, 1)
ans = 3
>> size(A, 2)
ans = 2
```
除了 size 函数,另外一个比较常用的是 length 函数,它获取的是矩阵中最大的那个维度的值,也就是说,对于一个 m×n 的矩阵return m if m > n else n。
对于向量来说,利用 length 可以快速获取向量的维数:
```m
>> V = [1 2 3 4]
V =
1 2 3 4
>> length(V)
ans = 4
octave:67> length(A)
ans = 3
```
### 4.3.向量 / 矩阵的运算
我们还是以上一小节定义的矩阵 A 为例。
获取矩阵指定行指定列的元素,注意这里的行、列都是从 1 开始的,比如获取矩阵 A 的第 3 行第 2 列元素:
```m
>> A(3, 2)
ans = 6
```
也可以获取矩阵整行或整列的元素,某行或某列的全部元素可以用 : 号代替,返回的结果就是一个行向量或一个列向量:
```m
>> A(3,:)
ans =
5 6
>> A(:, 2)
ans =
2
4
6
```
更一般情况,我们也可以指定要获取的某几行或某几列的元素:
```m
>> A([1, 3],:)
ans =
1 2
5 6
>> A(:,[2])
ans =
2
4
6
```
除了获取矩阵元素,我们也可以给矩阵的元素重新赋值。可以给指定行指定列的某一个元素赋值,也可以同时给某行或某列的全部元素一次性赋值:
```m
>> A(:,2) = [10, 11, 12]
A =
1 10
3 11
5 12
>> A(1,:) = [11 22]
A =
11 22
3 4
5 6
```
有的时候,我们还需要对矩阵进行扩展,比如增广矩阵,要在矩阵的右侧附上一个列向量:
```m
>> A = [A, [100; 101; 102]]
A =
1 2 100
3 4 101
5 6 102
```
上面第一句中,, 号也可以省略只使用空格也是一样的效果。这样那行赋值语句就变成这样A = [A [100; 101; 102]]
两个矩阵也可以进行组合:
```m
>> A = [1 2; 3 4; 5 6]
A =
1 2
3 4
5 6
>> B = [11 12; 13 14; 15 16]
B =
11 12
13 14
15 16
>> [A B]
ans =
1 2 11 12
3 4 13 14
5 6 15 16
>> [A; B]
ans =
1 2
3 4
5 6
11 12
13 14
15 16
```
我们也可以将矩阵的每一列组合在一起,转为一个更大的列向量:
```m
>> A(:)
ans =
1
3
5
2
4
6
```
接下来,为了说明矩阵与矩阵的运算,我们先来定义三个矩阵:
```m
>> A
A =
1 2
3 4
5 6
>> B
B =
11 12
13 14
15 16
>> C
C =
1 1
2 2
```
矩阵的相乘:
```m
>> A*C
ans =
5 5
11 11
17 17
```
矩阵 A 的各个元素分别乘以矩阵 B 对应元素:
```m
>> A .* B
ans =
11 24
39 56
75 96
```
点运算在这里可以理解为是对矩阵中每个元素做运算。比如,下面的例子就是对 A 中每个元素做平方,用 1 分别去除矩阵中的每个元素:
```m
>> A .^ 2
ans =
1 4
9 16
25 36
>> 1 ./ [1; 2; 3]
ans =
1.00000
0.50000
0.33333
```
有一种特殊情况是,当一个实数与矩阵做乘法运算时,我们可以省略.直接使用 * 即可:
```m
>> -1 * [1; -2; 3] % 也可以简写为 -1[1; 2; 3]
ans =
-1
2
-3
```
除此以外Octave 中内置的一些函数也是针对每个元素做运算的,比如对数运算、指数运算和绝对值运算等:
```m
octave:50> log([1; 2; 3])
ans =
0.00000
0.69315
1.09861
octave:51> exp([1; 2; 3])
ans =
2.7183
7.3891
20.0855
octave:53> abs([1; -2; 3])
ans =
1
2
3
```
矩阵的加法、转秩和逆:
```m
>> V + ones(length(V), 1) % V = [1; 2; 3]
ans =
2
3
4
% 矩阵的转秩
>> A'
ans =
1 3 5
2 4 6
% 求矩阵的逆
>> pinv(A)
ans =
0.147222 -0.144444 0.063889
-0.061111 0.022222 0.105556
-0.019444 0.188889 -0.102778
```
其他一些运算:
```m
% a = [1 15 2 0.5],求最大值
>> val = max(a)
val = 15
% 求最大值,并返回最大值的索引
>> [val, idx] = max(a)
val = 15
idx = 2
% 矩阵对应元素的逻辑运算
>> a <= 1
ans =
1 0 0 1
>> find(a < 3)
ans =
1 3 4
% 计算之和
>> sum(a)
ans = 18.500
% 计算乘积
>> prod(a)
ans = 15
% 向下取整
>> floor(a)
ans =
1 15 2 0
% 向上取整
>> ceil(a)
ans =
1 15 2 1
% 生成一个随机矩阵,矩阵元素的值位于 0-1 之间
>> rand(3)
ans =
0.458095 0.323431 0.648822
0.481643 0.789336 0.559604
0.078219 0.710996 0.797278
% 矩阵按行上下对换
>> flipud(eye(4))
ans =
Permutation Matrix
0 0 0 1
0 0 1 0
0 1 0 0
1 0 0 0
```
## 5.控制语句和函数
### 5.1.for、while、if 语句
octave 中 forwhile,if 语句的使用方式和 c 语言一样,不同的是大括号的功能是通过 end 实现的,下面例子中空格没有任何作用,只是起到视觉上清晰的作用。
首先我们定义一个列向量V = zeros(10, 1),然后通过 for 循环语句来更新向量 V 中的每一个元素:
```m
>> for i=1:10,
V(i) = 2^i;
end;
>> V
V =
2
4
8
16
32
64
128
256
512
1024
```
或者,我们也可以换一种写法:
```m
>> indices = 1:10;
>> indices
indices =
1 2 3 4 5 6 7 8 9 10
>> for i=indices,
disp(i);
end;
1
2
3
4
5
6
7
8
9
10
```
每一个 for 循环都是用 end 来结尾,固定写法,记住就好。
下面看 while 语句:
```m
>> i = 1;
>> while i <= 5,
disp(V(i));
i = i+1;
end;
2
4
8
16
32
>> i = 1;
>> while true,
disp(V(i));
if i > 5,
break;
end;
i = i + 1;
end;
2
4
8
16
32
64
```
while 和 if 语句同样需要使用 end 来表示完结,同时,在 for 或 while 中,我们也可以使用 break 关键词来提前退出循环。
### 5.2.函数
我们还是先看例子,然后再说明具体的写法:
```m
>> function y = squareNum(x)
y = x^2;
end;
>> squareNum(3)
ans = 9
```
在 Octave 中,定义一个函数需要使用 function 关键字,然后紧跟在 function 后面的是函数的声明,包括返回值,函数名称和参数,之后换行来实现具体的函数功能。
Octave 的函数不需要显示的返回语句Octave 会将函数第一行声明的返回值返回给调用方,因此,我们在函数体中只需将最终的计算结果赋给定义的返回值,比如上面例子中的 y。
还有一点需要说明的是,在 Octave 中,函数可以返回多个值:
```m
>> function [y1, y2] = calVal(x)
y1 = x^2;
y2 = x^3;
end;
>> [a, b] = calVal(3)
a = 9
b = 27
```
也可以把函数写进文件中,然后加载实现函数。
进入 octave 后cd 到指定的目录下,这里我是把函数文件存在 d 盘下的文件中
cd D:\app2018\octave
之后你可以用 pwd 打印出当前目录的路径看看是否是在该文件下。
在该目录下新建一个文件名为“squareThisNumber.m”后缀是.m 这样 octave 可以自动识别,双击后就会用 notepad++自动打开,就可以编辑自己的函数。
注意:文件名要和函数名保持一致。
```m
function y = squareThisNumber(x)
y = x^2;
```
函数的返回值是 y函数的自变量是 x这里只有一个返回值可以有多个返回值函数的主体是 y = x^2
```m
>> squareThisNumber(5)
ans = 25
```
这样就实现一简单求数平方的函数。
## 6.加载和保存数据
在上面一节中,介绍了如何在 Octave 的交互环境定义函数。但是大部分时候,我们都会将函数保存在文件中,从而在需要时可以随时调用。我们也能够在文件中存储数据,比如矩阵参数等,使用 load 命令可以将文件中的内容加载进来。
通常会比较常用的一些命令有如下几个:
显示当前的工作目录:
```m
>> pwd
ans = /Users/xiaoz
```
进到指定的目录:
```m
>> cd octave
>> pwd
ans = /Users/xiaoz/octave
```
列出当前目录下的文件:
```m
>> ls
featureX.dat priceY.dat
```
加载当前目录下的数据(也可以使用 load 函数):
```m
>> load featuresX.dat
>> load pricesY.dat
```
查看当前工作空间下都有哪些变量:
```m
>> who
Variables in the current scope:
ans featuresX pricesY
```
查看详细的变量信息:
```m
>> whos
Variables in the current scope:
Attr Name Size Bytes Class
==== ==== ==== ===== =====
ans 1x13 13 char
featuresX 3x2 48 double
pricesY 3x1 24 double
Total is 22 elements using 85 bytes
>> featuresX % 查看加载进来的变量
featuresX =
123 1
456 2
789 3
octave:15> pricesY
pricesY =
11
22
33
```
clear 命令可以清除一个变量,需要特别小心的是,如果后面没有跟具体的变量名,则会清空全部变量:
```m
>> clear ans
```
保存数据到指定的文件,它的语法格式是这样的:
save {file_name} {variables}
```m
>> V = pricesY(1:2) % 获取第一列的前两个元素
V =
11
22
% 保存变量 V hello.mat 文件
>> save hello.mat V;
>> ls
featuresX.dat hello.mat pricesY.dat
```
在保存的时候也可以指定一种编码格式,比如下面的例子指定了 ascii 编码,如果不指定,数据将会被保存为二进制格式。
```m
>> save hello.txt V -ascii
```
有一点需要提示的是:假如你使用 pwd 命令发现当前的工作目录是 A同时你实现了一个函数 someFunc存储在文件 someFunc.m 中,如果这个 someFunc.m 文件不在 A 目录,那么在使用 someFunc 函数之前,需要先调用 load 方法将其加载进来,反之可以直接使用。
## 7.绘制图形
在本篇文章的最后一节,我们来简单的说下 Octave 的绘图能力。
不像其他语言那般繁琐Octave 中绘图的接口设计的非常简洁和直观,让你非常容易上手。
我们以绘制一个 sin 函数曲线和一个 cos 函数曲线为例,来说明如何在 Octave 中绘图。
首先,我们还是先来定义数据
```m
>> t = [0:0.01:0.98];
>> y1 = sin(2*pi*4*t);
>> y2 = cos(2*pi*4*t);
```
这里的 t 我们看做是横轴y1 看做是纵轴,然后调用 plot 函数
```m
>> plot(t, y1);
```
之后会立即在一个新窗口生成我们想要的图形
sin 函数
接下来我们继续在这个图像上绘制 cos 函数。这时需要用到 hold on 命令,它的作用是将新图像画在旧图像上面,而不是覆盖旧图像。
为了区分 sin 函数,我们将 cos 函数的曲线用红色标识:
```m
octave:10> hold on;
octave:11> plot(t,y2, 'r');
```
这个时候,你看到的图形应该是这个样子的:
sin 和 cos
图形有了,最后一步就是标明横轴和纵轴分别代表的含义,再给图形起一个有意义的名字
```m
>> xlabel('time'); % 指定 X 轴的名称
>> ylabel('value'); % 指定 Y 轴的名称
>> legend('sin', 'cos'); % 标识第一条曲线是 sin,第二条曲线是 cos
>> title('sin and cos function'); % 给图片附一个标题
```
最终,这个图形是这样式的:
sin and cos
如果你愿意,还可以将其作为一个图片保存下来:
```m
octave:16> print -dpng 'sin_cos.png'
```
在绘图中,如果你反悔了,想重新绘图,怎么办呢?也很简单,只要输入 clf 命令Octave 会将绘图框中的图形全部清空。
不论何时,输入 close 命令Octave 会关闭该绘图窗口。
```m
>> figure(1);plot(t,y1);
>> figure(2);plot(t,y2);
```
这样就可以分别用两个窗口显示图像。
```m
>> subplot(1,2,1); %这样做是把窗口分成一个 1*2 的格子,使用第一个格子;
>> plot(t,y1);
>> subplot(1,2,2);
>> plot(t,y2);
>> axis(0.5 1 -1 1) %调整右边图像的 xy 坐标的范围。
>> A = magic(5);
>> imagesc(A); %生成一个 5*5 的色块
```
## 8.矢量
有道时候方程向量化,计算起来会更加高效。
A = [a1;a2;a3;........;an]
X = [x1;x2;x3;..........xn]
例子h(x) = a1x1 + a2x2 + a3x3 + .........+ anxn = AX'(X 的转置);
没有向量化之前可能会使用 for 循环的方式实现求和函数,但是转换成向量来做只需要一条语句就能实现;
p = A * X
其实Octave 能做的远远不止这些,本篇介绍的这些也不过是冰山一角,但对于我们实践机器学习的算法已经基本足够。不要忘记的是,当你对某个函数不清楚的时候,试试 help {func name}。