潮虫生活在阴暗处,见不得光。有一天被晒在阳光下,它不会感激可以沐浴阳光,而是四处逃窜
研究总体流程 研究总体流程
研究目前基础物理模型已建立。需要验证代码与建立运动方程式的正确性与一致性。数值计算运用常微分方程与python程序plot所画图进行对比。 以下是当前所处状态的可视化流程图。
2021-06-25
模型改进 模型改进
模型改进需要判断特殊情况下的模型运动 水平竖直方向同时做位移运动 是圆弧运动lcostheta? lsintheta? 需要自定义初始化而非随机初始化验证正确与否的方法: 特殊情况判断竖直状态下 角度初始值为0竖直向上运动 单摆的角度会一直
2021-06-09
经验回放原理 经验回放原理
时序差分学习(Temporal Difference Learning)强化学习中常用时序差分学习来更新模型,时序差分学习的一般流程是: 1.模型根据获取到的状态 st 决定采取动作 at 。 2.环境在执行动作 at 后会给出对应的奖励
2021-04-16
深层学习方法总结 深层学习方法总结
深层学习方法https://zhuanlan.zhihu.com/p/25913410 蒙特卡罗方法(英语:Monte Carlo method)也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统
2021-04-16
深层学习疑难知识点 深层学习疑难知识点
有关深层学习的疑难知识点self含义init 方法的第一个参数永远是 self ,表示创建的实例本身,因此,在 init 方法的内部,就可以把各种属性绑定到 self,因为 self 就指向创建的实例本身。使用了 init 方法,在创建实例
2021-03-30
DQN DQN
import numpy as np import matplotlib.pyplot as plt %matplotlib inline import gym from JSAnimation.IPython_display impo
2021-03-26
损失函数 损失函数
损失函数nn.CrossEntropyLoss()这个损失函数用于多分类问题虽然说的是交叉熵,但是和我理解的交叉熵不一样。nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使
2021-03-12
图像分析 图像分析
from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784',version = 1,data_home = ".") X = mnist.data/
2021-03-03
倒单摆深入学习 倒单摆深入学习
这里的模型是gym库的cartpole-v0采用深入学习Q学习构建agent,brain,environment对于研究的模型来说可以通过gym来自己创建模型,具体操作之后学习 import numpy as np import matpl
2021-02-24
Qlearning Qlearning
QlearningQLearning是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward
2021-02-22
1 / 2