遗传变异分类数据集

文件列表(压缩包大小 3.59M)      点击页面右上角“下载”按钮下载

概述

遗传变异分类数据集

介绍

  • ClinVar是一个公共资源,包含有关人类遗传变异的记录。

  • 临床实验室将这些变体(通常是人工地)按良性,可能良性,不确定性,可能致病性和致病性分类。当临床医生或研究人员试图解释该变体是否对给定患者的疾病产生影响时,具有冲突分类的变体会引起混乱。

  • 目的是预测ClinVar变体是否具有冲突的分类。在这里作为二进制分类问题提出,其中数据集中的每个记录都是遗传变异。

内容

  • 包含以下三类:
  1. 可能是良性/良性
  2. VUS
  3. 可能是致病的/致病的
  • 冲突的分类已分配给CLASS列。它是变体是否具有冲突分类的二进制表示形式,其中0表示一致的分类,而1表示冲突的分类。

  • 由于此问题仅与具有多个分类的变体有关,因此从只有一次提交的原始ClinVar .vcf中删除了所有变体。

数据集转载自 https://www.kaggle.com/kevinarvai/clinvar-conflicting

理工酷提示:

如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku666,并备注:产品反馈

评论(0)

0/250
免费
赞 4
收藏 0
评论 0
举报

网站声明:本站所有资源均为用户上传,如果侵犯了您的合法权益,请点击上方举报按钮,或添加管理员微信:ligongku666 ,并备注:举报。我们将快速核实并处理。

文件编号:598
上传时间:2021-01-28
文件大小:3.59M

🍊小桔子

声望 • 1732

分类:
计算机/软件
标签:
数据集