Skip to content
This repository has been archived by the owner on Dec 27, 2024. It is now read-only.

通过统计提升赛事预测准确度 #62

Open
NateScarlet opened this issue Jun 16, 2021 · 21 comments
Open

通过统计提升赛事预测准确度 #62

NateScarlet opened this issue Jun 16, 2021 · 21 comments
Labels
enhancement New feature or request

Comments

@NateScarlet
Copy link
Owner

暂时想法是将自动将属性和赛事结果存储至本地/服务器
之后有类似情况时可以进行参考
也可以使用这个数据来优化预测算法

@NateScarlet NateScarlet added the enhancement New feature or request label Jun 16, 2021
@NateScarlet
Copy link
Owner Author

研究了一下发现好像可以用 Github wiki 当数据库 只要客户端 git 配置了 github 账号就能从脚本里面自动更新数据

对于没有 github 账号的用户可以写一个收集报告然后定时更新的服务 工作量不大 不过好像没有必须要那些数据的理由

@NateScarlet
Copy link
Owner Author

NateScarlet commented Jun 17, 2021

放 wiki 的话可以直接写个纯网页统计 数据可以直接获取 https://raw.githubusercontent.com/wiki/NateScarlet/auto-derby/Home.md

直接使用可能会格式不对,应该定时抓取并提交到主仓库

@NateScarlet
Copy link
Owner Author

cloudflare worker 免费计划提供每天100000个请求 应该够了
用 git 存非必须的单向增长数据还是不太好

@Splendent
Copy link

這邊討論下WIKI的NUTURING RESULT
關於收集數據的有效性有幾點想法

  1. 支援卡等級/名稱
    基本上支援卡等級就差不少了,就個人測試,30<->50等的同樣支援卡(小北)可以差到約一千分
  2. 版本/COMMIT
    有的COMMIT有動到數值計算,影響到育成/比賽的結果,似乎應該也要納入考量
  3. 自訂數值
    理由同2.

說回來,如果單純以PARSE資料的方面來看,目前的WIKI欄位便足夠且相當方便
但若考慮到分享育成結果,提供他人育成範本,那可能就得考慮以上幾點,不然立足點會差異太多?

@NateScarlet
Copy link
Owner Author

支援卡要手动输的话太长了

版本手动输入也麻烦 现在用日期粗略代替

需要自动上报才最方便信息最详细

@Small-Ku
Copy link
Contributor

支援卡有機會從編成情報這邊,按進卡裡OCR得到嗎?
圖片
雖然按進去後,背景有點複雜
圖片

@NateScarlet
Copy link
Owner Author

直接卡面生成ID然后OCR支援卡等级就足够了 不需要识别具体属性 卡的属性在指定等级都是一样的

@NateScarlet
Copy link
Owner Author

通过属性预测比赛结果这个应用场景应该很适合机器学习

不过我需要自学一下机器学习

@fatinghenji
Copy link

通过属性预测比赛结果这个应用场景应该很适合机器学习

不过我需要自学一下机器学习

提升准确率还是要看技能,属性不够但是搭配技能可能就可以跑出很好的成绩。

@NateScarlet
Copy link
Owner Author

预测是预测90%几率的最高成绩 不是可能 技能发动率你有数据吗

@NateScarlet
Copy link
Owner Author

而且自动育成不加技能 如果你不能无技能ura胜利说明支援卡不够好

@NateScarlet
Copy link
Owner Author

预测时不含技能的后果:

  • 预测的名次会偏后,这比偏前好,降低自动参加比赛的失败率
  • 属性不够靠技能凑时会经常比赛前暂停,支援卡等级上来之后就缓解了

@NateScarlet
Copy link
Owner Author

绿色技能发动倒是可以直接算上 单圈40双圈60 条件符合100%发动 但是数值占比比较小意义不大

@fatinghenji
Copy link

而且自动育成不加技能 如果你不能无技能ura胜利说明支援卡不够好

是这样,我的支援卡等级的确不好

绿色技能发动倒是可以直接算上

应该是只有一部分可以。比如说幸运7,一匹狼这种就没法计算

@NateScarlet
Copy link
Owner Author

一匹狼:游戏数据库里面我记得有每场比赛的对手技能数据
幸运7: 1 / 人数

@NateScarlet
Copy link
Owner Author

其实发动几率低于90%的技能都可以无视掉 因为预测的是下限

@Jimmy-Ru-217
Copy link

话说现在有dataset了吗?我学过一定的机器学习和深度学习,我想试着尝试一下。此外对于赛事预测的话,在nurturing中我们预测的是“相对”名次,这不仅取决于我们自己的属性,同样取决于其他电脑的马娘的属性。在相同属性的条件下,对于不同年份的同一个比赛得出的结果也会不同。这是否意味着我们需要的训练样本大大增加?如果要采集数据的话,我个人觉得需要的attribute有马娘的五个属性,跑法,当前游戏中的日期,赛场的距离,场地适应度,跑法适应度,距离适应度。对于赛场,如果细化的话可以额外增加赛场的名字(因为距离相近的比赛,电脑马娘的强度可能存在差别)。而label即为我们马娘在该场比赛中的名次。我认为该种方法无需知道除了我们自身以外的其他马娘的属性便可以对于我们的排名进行预测。
而另一种方式是,我似乎在Twitter上看到过马娘跑完整个赛程的所需时间的公式。虽然公式中存在一定的bias,但是如果我们悲观估计我们自己的马娘可以得到我们马娘在某一个比赛中的下限,乐观估计其他马娘可以得到其上限。这存在一定的可操作性,但是缺点也很明显,需要的是跟我们比赛的其他马娘的属性。我没有留意过是否在一整轮游戏中某一场比赛中马娘们的属性是固定不会变动的,如果是的话我认为这或许也是一种办法。

@NateScarlet
Copy link
Owner Author

还没有 需要写个服务端来收集

客户端只要 #170 加了比赛结束自定义逻辑后写个数据上报插件就行

@fatinghenji

This comment has been minimized.

@NateScarlet

This comment has been minimized.

@NateScarlet
Copy link
Owner Author

1.13.0之后会在data文件夹下记录比赛结果了 但是不包含角色和技能

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

5 participants