分类: python | 小杨的博客

文章分类
C++ 23 随笔 1 blog 2 python 12 Linux 1 MySQL 5 文本编辑器 1 控制系统 1 批量操作 2 秋季招聘 2 工具 1 JAVA 1 Bug 1 宝～ 2 java 1
                            
                            研究总体流程
                        
                                研究目前基础物理模型已建立。需要验证代码与建立运动方程式的正确性与一致性。数值计算运用常微分方程与python程序plot所画图进行对比。
以下是当前所处状态的可视化流程图。

                                2021-06-25
                            
                                    python
                                
                            深度学习
                        
                            模型改进
                        
                                模型改进需要判断特殊情况下的模型运动
水平竖直方向同时做位移运动 是圆弧运动lcostheta? lsintheta?
需要自定义初始化而非随机初始化验证正确与否的方法：
特殊情况判断竖直状态下 角度初始值为0竖直向上运动 单摆的角度会一直
                            
                                2021-06-09
                            
                                    python
                                
                            深度学习
                        
                            经验回放原理
                        
                                时序差分学习（Temporal Difference Learning）强化学习中常用时序差分学习来更新模型，时序差分学习的一般流程是：
1.模型根据获取到的状态 st 决定采取动作 at 。
2.环境在执行动作 at 后会给出对应的奖励 
                            
                                2021-04-16
                            
                                    python
                                
                            深度学习
                        
                            深层学习方法总结
                        
                                深层学习方法https://zhuanlan.zhihu.com/p/25913410
蒙特卡罗方法（英语：Monte Carlo method）也称统计模拟方法，是1940年代中期由于科学技术的发展和电子计算机的发明，而提出的一种以概率统
                            
                                2021-04-16
                            
                                    python
                                
                            深度学习
                        
                            深层学习疑难知识点
                        
                                有关深层学习的疑难知识点self含义init 方法的第一个参数永远是 self ，表示创建的实例本身，因此，在 init 方法的内部，就可以把各种属性绑定到 self，因为 self 就指向创建的实例本身。使用了 init 方法，在创建实例
                            
                                2021-03-30
                            
                                    python
                                
                            深度学习
                        
                            DQN
                        
                                import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import gym

from JSAnimation.IPython_display impo
                            
                                2021-03-26
                            
                                    python
                                
                            深度学习
                        
                            损失函数
                        
                                损失函数nn.CrossEntropyLoss()这个损失函数用于多分类问题虽然说的是交叉熵，但是和我理解的交叉熵不一样。nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使
                            
                                2021-03-12
                            
                                    python
                                
                            算法公式
                        
                            图像分析
                        
                                from sklearn.datasets import fetch_openml
mnist = fetch_openml('mnist_784',version = 1,data_home = ".")

X = mnist.data/
                            
                                2021-03-03
                            
                                    python
                                
                            图像分析
                        
                            倒单摆深入学习
                        
                                这里的模型是gym库的cartpole-v0采用深入学习Q学习构建agent，brain,environment对于研究的模型来说可以通过gym来自己创建模型，具体操作之后学习
import numpy as np
import matpl
                            
                                2021-02-24
                            
                                    python
                                
                            Q学习实例
                        
                            Qlearning
                        
                                QlearningQLearning是强化学习算法中value-based的算法，Q即为Q（s,a）就是在某一时刻的 s 状态下(s∈S)，采取 动作a (a∈A)动作能够获得收益的期望，环境会根据agent的动作反馈相应的回报reward
                            
                                2021-02-22
                            
                                    python
                                
                            深度学习