九游·体育(NineGameSports)官方网站-数智体育价值引领者

九游体育科技:2024人工智能算法指南合集docx-九游·体育科技集团
i1pcban.jpg i1pcban.jpg

新闻九游

九游体育科技:2024人工智能算法指南合集docx

2024-12-14 

分享到

  大家都在用,各大公司开源工具库都有Python接口,并且都是主流,我们实际干活很大程度上都是使用这些库帮助我们完成任务

  为什么建议使用Notebook?主要原因在于它不光能写代码,还可以做笔记尤其是代码需要一步步执行的时候,可以得到每一步结果并保留下来,在可视化展示方面就更方便了!

  (我觉得语言只是一门工具,不需要先都学彻底了才能干活,边做事边学习应该会更加深理解,忌光看书不练习)

  ,大概用哪个函数,等实际用的时候还是需要查一查API的,这么多参数都记下来不太切合实际,动手查的能力也很重要)

  什么是机器学习呢?说白了就是你告诉机器你想做什么?并且给它一堆数据让它去模仿着做!

  (比如,咱们上高中,老师会告诉我们一个目标就是考高分,然后给我们一堆练习册和答案,我们的目的就是让我们做的题的解和答案一致)

  机器学习中有很多经典算法,既然要学习,那就需要清楚一个算法是怎么来的(推导)以及该如何应用

  数学重要吗?非常重要的,大学的数学基础即可,如果你都忘了,大致的印象还是有的吧,我觉得与其从头过一遍数学,不如边学边查,一个合适的做法就是哪里不会点哪里,我每天也在查很多知识点

  在校的同学们:推导肯定是重中之重了,因为对于我们来说学习的目的就是转换成自身的资本让我们更有竞争力,面试与笔试的时候,这些推导九游智能体育科技全来了

  那我学机器学习还是深度学习呀?一切的基础都是机器学习,做任何事情没有坚实的基础只会越来越迷茫,机器学习觉得值得你从头开始

  如果有一个地方死活看不懂怎么办?很常见的情况,我也经常卡在一个地方好久,这时候有个圈子来交流当然更好(推荐找几个哥们一起,自己坚持下去好累),不过我们也可以先继续前进,等回过头来再想想,没准就想通啦!

  习惯很重要,当你看别人的资料觉得掌握的差不多了,其实你明天估计就忘的也差不多了,自己动手从头开始做笔记(不是照抄人家的,是写自己的)或者博客都是很好的选择,只要你自己能写出来了才算真正的掌握!

  案例的积累作用很大,其实我们干活是什么样的呢?主要就是在模仿,我们并不是科学家,能做事才能有用的,既然人家是这么做的,并且做的不错,那我们去模仿做出来的就是我们自己的!

  算法原理推导:从零开始,对一个机器学习/深度学习算法进行推导,得出其最终的解法,评估参数对结果的影响。

  案例实战:基于真实数据集,结合Python工具库,从数据预处理开始一步步建模完成整个案例。

  一旦构造好了决策树,那么分类或者预测任务就很简单了,只需要走一遍就可以了,那么难点就在于如何构造出来一颗树,这就没那么容易了,需要考虑的问题还有很多的!

  目标:通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个当成根节点,以此类推。

  (解释:说白了就是物体内部的混乱程度,比如杂货市场里面什么都有那肯定混乱呀,专卖店里面只卖一个牌子的那就稳定多啦)

  显然A集合的熵值要低,因为A里面只有两种类别,相对稳定一些而B中类别太多了,熵值就会大很多。(在分类任务中我们希望通过节点分支后数据类别的熵值大还是小呢?)

  当p=0或p=1时,H(p)=0,随机变量完全没有不确定性当p=0.5时,H(p)=1,此时随机变量的不确定性最大

  同样的方式可以计算出其他特征的信息增益,那么我们选择最大的那个就可九游智能体育科技以啦,相当于是遍历了一遍特征,找出来了大当家,然后再其余的中继续通过信息增益找二当家!

  预剪枝:边建立决策树边进行剪枝的操作(更实用)后剪枝:当建立完决策树后来进行剪枝操作

  直接密度可达:若某点p在点q的r邻域内,且q是核心点则p-q直接密度可达。

  密度可达:若有一个点的序列q0、q1、…qk,对任意qi-qi-1是直接密度可达的

  直接密度可达:若某点p在点q的r邻域内,且q是核心点则p-q直接密度可达。

  K距离:给定数据集P={p(i);i=0,1,…n},计算点P(i)到集合D的子集S中所有点之间的距离,距离按照从小到大的顺序排序,d(k)就被称为k-距离。

  参数难以选择(参数对结果的影响非常大)Sklearn中效率很慢(数据削减策略)

  正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大

  逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测

  逆向概率:迎面走来一个穿长裤的学生,你只看得见他(她)穿的是否长裤,而无法确定他(她)的性别,你能够推断出他(她)是女生的概率是多大吗?

  P(PantsBoy)是条件概率,即在Boy这个条件下穿长裤的概率是多大,这里是100%,因为所有男生都穿长裤

  问题是我们看到用户输入了一个不在字典中的单词,我们需要去猜测:“这个家伙到底真正想输入的单词是什么呢?

  对于不同的具体猜测h1h2h3..,P(D)都是一样的,所以在比较P(h1D)和P(h2D)的时候我们可以忽略这个常数

  对于给定观测数据,一个猜测是好是坏,取决于“这个猜测本身独立的可能性大小(先验概率,Prior)”和“这个猜测生成我们观测到的数据的可能性大小。

  对于不同的具体猜测h1h2h3..,P(D)都是一样的,所以在比较P(h1D)和P(h2D)的时候我们可以忽略这个常数

  对于给定观测数据,一个猜测是好是坏,取决于“这个猜测本身独立的可能性大小(先验概率,Prior)”和“这个猜测生成我们观测到的数据的可能性大小。

  比如用户输入tlp,那到底是top还是tip?这个时候,当最大似然不能作出决定性的判断时,先验概率就可以插手进来给出指示——“既然你无法决定,那么我告诉你,一般来说top出现的程度要高许多,所以更可能他想打的是top”

  掷一个硬币,观察到的是“正”,根据最大似然估计的精神,我们应该猜测这枚硬币掷出“正”的概率是1,因为这个才是能最大化P(Dh)的那个猜测

  如果平面上有N个点,近似构成一条直线,但绝不精确地位于一条直线上。这时我们既可以用直线),也可以用二阶多项式(模型2)拟合,也可以用三阶多项式(模型3),特别地,用N-1阶多项式便能够保证肯定能完美通过N个数据点。那么,这些可能的模型之中到底哪个是最靠谱的呢?

  D来表示这封邮件,注意D由N个单词组成。我们用h+来表示垃圾邮件,h-表示正常邮件

  先验概率:P(h+)和P(h-)这两个先验概率都是很容易求出来的,只需要计算一个邮件库里面垃圾邮件和正常邮件的比例就行了。

  假设di与di-1是完全条件无关的(朴素贝叶斯假设特征之间是独立,互不影响)

  决策边界:选出来离雷区最远的(雷区就是边界上的点,要LargeMargin)

  2024-2025学年广东省深圳福田区实验学校七年级上学期期中英语试题及答案.pdf

  四年级英语上册Unit1Myclassroom测试题2无答案人教PEP.docx

  2023春国开幼儿园教育质量评价形考任务2试题及答案(第8套).docx

  原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者