Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Ensembl RDF 更新問題の代替案としてのBiomart RESTの利用 #61

Open
hiromasaono opened this issue Apr 15, 2021 · 2 comments
Open
Labels
bug Something isn't working invalid This doesn't seem right

Comments

@hiromasaono
Copy link
Contributor

  • IDペア精査の過程で、ensembl_- の各ペアで膨大な重複行があることが判明。

  • Ensembl RDFを修正しないといけない。

  • ENSELUGとENSDCDGが, 100万行で切れているかもしれない

  • ensembl_transcript-go エンドポイントがコケて(?)取得漏れあり 7129297 12737835 44174911 行目

  • Ensembl RDF は今後本家で更新されない。

  • 今使っているミラーはバージョン102。最新版は103。

  • 最新版のミラーを作り続ける?

  • Biomart のREST でそれぞれのIDペアは作成できる。

  • 全生物種分、wget で取る。

@hiromasaono
Copy link
Contributor Author

hiromasaono commented Apr 16, 2021

@skwsm @mitsuhashi TogoVarでも使うということで、RDF作成のご対応をよろしくおねがいします🙏。(4月中に間に合う感じでしょうか…)

@hiromasaono hiromasaono added bug Something isn't working invalid This doesn't seem right labels Apr 16, 2021
@skwsm
Copy link
Contributor

skwsm commented Apr 20, 2021

@hiromasaono @mitsuhashi 先程、小野さんと話したのですが、5月半ばまでにRDF化コンバータを作成することになりました(TogoIDも6月1日に正式公開のため)。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working invalid This doesn't seem right
Projects
None yet
Development

No branches or pull requests

2 participants