强化学习入门: Q-Learning的python实现

强化学习入门: Q-Learning的python实现

观摩了微软俱乐部游戏组大佬的一个unity+tensorflow搞出来的的游戏AI之后对强化学习产生了点兴趣(其实说起来我当时进俱乐部面试的是游戏组最后给我整到软件了???),准备从小白开始学习一下强化学习和游戏里的AI。不过,查了很多资料之后直观感受是,国内这方面的优质资源真的很少,尤其是面向新手的。。。讲的乱七八糟,看的头皮发麻。经过一番扒拉后,找到了两个非常nice的国外大神做的入门教程,链接分别在

当我看到这两个Tutorial的时候感觉就像这位朋友的评论一样hhh

这里的代码用到的环境是openAI-gym里的Taxi-v2,这个游戏的界面长这样

简单说下这个图的含义:

总共5*5个空格,RGBY是四个表示乘客/目的地的位置 继续阅读“强化学习入门: Q-Learning的python实现”

[填坑] 一个私人视频站

忽然想起来自己还有一个一块钱一年买的垃圾.xyz域名,然后意识到我的一个月5美元的小鸡其实现在的存在很鸡肋,就想了想怎么能让它再多做点贡献。。。。

然后捣鼓了一天就整出来一个这样的垃圾视频站

目前pc端可以正常播放,这个资源采集的api更新的还挺快,权游第八季基本上当天更新的样子。。。

不过我还没做手机端适配,手机上现在会黑屏,不过我最近一段时间应该是没空做了emmmmm又得比赛又得学习又得准备考试,留了个坑等到有空填吧坑已填好,早上做了下手机端适配,顺便把m3u8播放器也整好了