研究总体流程 研究目前基础物理模型已建立。需要验证代码与建立运动方程式的正确性与一致性。数值计算运用常微分方程与python程序plot所画图进行对比。 以下是当前所处状态的可视化流程图。 2021-06-25 python 深度学习 模型改进 模型改进需要判断特殊情况下的模型运动 水平竖直方向同时做位移运动 是圆弧运动lcostheta? lsintheta? 需要自定义初始化而非随机初始化验证正确与否的方法: 特殊情况判断竖直状态下 角度初始值为0竖直向上运动 单摆的角度会一直 2021-06-09 python 深度学习 经验回放原理 时序差分学习(Temporal Difference Learning)强化学习中常用时序差分学习来更新模型,时序差分学习的一般流程是: 1.模型根据获取到的状态 st 决定采取动作 at 。 2.环境在执行动作 at 后会给出对应的奖励 2021-04-16 python 深度学习 深层学习方法总结 深层学习方法https://zhuanlan.zhihu.com/p/25913410 蒙特卡罗方法(英语:Monte Carlo method)也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统 2021-04-16 python 深度学习 深层学习疑难知识点 有关深层学习的疑难知识点self含义init 方法的第一个参数永远是 self ,表示创建的实例本身,因此,在 init 方法的内部,就可以把各种属性绑定到 self,因为 self 就指向创建的实例本身。使用了 init 方法,在创建实例 2021-03-30 python 深度学习 DQN import numpy as np import matplotlib.pyplot as plt %matplotlib inline import gym from JSAnimation.IPython_display impo 2021-03-26 python 深度学习 损失函数 损失函数nn.CrossEntropyLoss()这个损失函数用于多分类问题虽然说的是交叉熵,但是和我理解的交叉熵不一样。nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使 2021-03-12 python 算法公式 图像分析 from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784',version = 1,data_home = ".") X = mnist.data/ 2021-03-03 python 图像分析 倒单摆深入学习 这里的模型是gym库的cartpole-v0采用深入学习Q学习构建agent,brain,environment对于研究的模型来说可以通过gym来自己创建模型,具体操作之后学习 import numpy as np import matpl 2021-02-24 python Q学习实例 Qlearning QlearningQLearning是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward 2021-02-22 python 深度学习