潮虫生活在阴暗处,见不得光。有一天被晒在阳光下,它不会感激可以沐浴阳光,而是四处逃窜
倒单摆深入学习 倒单摆深入学习
这里的模型是gym库的cartpole-v0采用深入学习Q学习构建agent,brain,environment对于研究的模型来说可以通过gym来自己创建模型,具体操作之后学习 import numpy as np import matpl
2021-02-24
Qlearning Qlearning
QlearningQLearning是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward
2021-02-22
迷路问题方案优化 迷路问题方案优化
计算每个状态下 执行某一动作的概率将最初的概率表更新直到概率表的变化微乎其微时终止从而得到最优路线这里介绍以下softmax函数:特征对概率的影响是乘性的假设有一个数组V,Vi表示V中的第i个元素,那么这个元素的softmax数值为:$$S
2021-02-21
深度学习 深度学习
迷路问题import numpy as np import matplotlib.pyplot as plt %matplotlib inline fig = plt.figure(figsize = (5,5)) ax = plt.gc
2021-02-19
头文件介绍 头文件介绍
stdio.h就是指“standard input&output” 意思就是说标准输入输出头文件! 所以了,用到标准输入输出函数时,就要调用这个头文件 C 头文件 include <assert.h> //设定
2021-02-15
算法基础1 算法基础1
模板函数模板语法形式:template<模板参数表>函数定义模板参数表的内容类型参数 class(或typename)标识符常量参数 类型说明符 标识符模板参数 template<参数表>class标识符 函数模板示
2021-02-14
云台设计 云台设计
云台设计构想及编程应用(C语言—–C++转换未完成)控制平台设计构想传感器读取初始数据卡尔曼滤波算法获取yaw,roll,pitch的角度将数据转化为电机的目标值 测量值如果和目标值相等 读取磁编码测量其位置值 测
2021-02-09
指针与数组 指针与数组
定义指向数组元素的指针定义与赋值int a[10],*pa;pa=&a[0];或者pa=a;等效的形式 pa就是a[0],* (pa+1)就是a[1]….* (pa+i)就是a[i]!!!重点!!!a[i],* (pa+i),*
2021-02-08
Sublime中文设置以及g++安装 Sublime中文设置以及g++安装
markdown文本编辑器的初期配置官网下载,并安装好, 刚安装好的是没有 Package Control 选项 找到 Tools->Install Package Control 选项,即可调出 Package Control
程序员面试题 程序员面试题
C风格字符串和字符数组字符串常量以双引号括起来的字符序列是字符串常量,通常编译器会在末尾自动添加一个空字符 //字符常量‘A’表示单个字符A–”A“是字符串常量表示单个字符A和空字符null–!!C风格字符串末尾必须有一个’\0’–ch
2021-02-07
5 / 6