搜索
bottom↓
回复: 26

人类的DNA信息能否保存到电脑上?

[复制链接]

出45入88汤圆

发表于 2020-3-23 16:42:19 | 显示全部楼层 |阅读模式
比如把所有人的DNA信息保存到数据库里。在以后在寻亲时就方便好多。被拐卖的儿童只要在数据库上一配对就知道生父是谁。

阿莫论坛20周年了!感谢大家的支持与爱护!!

月入3000的是反美的。收入3万是亲美的。收入30万是移民美国的。收入300万是取得绿卡后回国,教唆那些3000来反美的!

出0入0汤圆

发表于 2020-3-23 16:43:16 | 显示全部楼层
基因公司有  但是凡人肯定看不到的

出45入88汤圆

 楼主| 发表于 2020-3-23 16:55:06 | 显示全部楼层
kydl2345 发表于 2020-3-23 16:43
基因公司有  但是凡人肯定看不到的

要多少T空间才能储存一个人?

出330入1862汤圆

发表于 2020-3-23 17:03:49 | 显示全部楼层
想一想,把XY里面的Y删掉,然后选中X,Ctrl+C, Ctrl+V

出0入4汤圆

发表于 2020-3-23 17:05:11 | 显示全部楼层
你觉得找不回来是技术问题么?

出0入0汤圆

发表于 2020-3-23 17:21:51 来自手机 | 显示全部楼层
比如说颜色就是 rgb 三个字节吗?还要想多少空间呢?

出0入90汤圆

发表于 2020-3-23 17:47:20 | 显示全部楼层
Edesigner. 发表于 2020-3-23 16:55
要多少T空间才能储存一个人?

几百兆而已

出0入442汤圆

发表于 2020-3-23 17:50:04 | 显示全部楼层

量不少。我老伙计他们公司跑数据一组就是几十g起步吧,服务器都配的大内存的512g的。

出0入90汤圆

发表于 2020-3-23 18:00:15 | 显示全部楼层
wye11083 发表于 2020-3-23 17:50
量不少。我老伙计他们公司跑数据一组就是几十g起步吧,服务器都配的大内存的512g的。 ...

全基因组测序,要分割,要有很多重合的部分,才能再拼回去,这样会有100G左右的数据
拼完了就剩3G的文本,存成二进制是750M
如果加上注释和空间信息等就会大很多了

出0入0汤圆

发表于 2020-3-23 18:16:25 来自手机 | 显示全部楼层
怎么知道各个碱基对有什么作用?

出0入224汤圆

发表于 2020-3-23 18:27:14 来自手机 | 显示全部楼层
现在上户口不是都要这样弄吗?

出0入0汤圆

发表于 2020-3-23 18:28:28 | 显示全部楼层
某些重要人物需要换肾换心脏要匹配供体也方便多了

出0入90汤圆

发表于 2020-3-23 18:47:24 | 显示全部楼层
只能这么说,技术会给人类带来便利,但是这个结果并不一定是人类想要的。

好比,二战德国为了便利、加快杀死犹太人,让IBM帮他们研发设备。
再就是黑客帝国里面,人类最后变成了生物电池、意识生活在网络世界里面。
又或者终结者里面的天网系统。

DNA信息最终肯定可以保存在电脑里面,但是也许你将来并不希望自己的孩子的基因被存储到电脑里面,成为某些人的器官库。

出10入120汤圆

发表于 2020-3-23 19:32:20 来自手机 | 显示全部楼层
呵呵,下一步能不能把记忆银子保存在电脑上呢

出140入158汤圆

发表于 2020-3-23 19:42:28 | 显示全部楼层
每2bit表示一对碱基,800M不到。

出45入88汤圆

 楼主| 发表于 2020-3-23 19:45:36 | 显示全部楼层
amigenius 发表于 2020-3-23 19:42
每2bit表示一对碱基,800M不到。

那对比匹配应该好快。每个省弄一台服务器。

出45入88汤圆

 楼主| 发表于 2020-3-23 19:45:57 | 显示全部楼层
honami520 发表于 2020-3-23 18:47
只能这么说,技术会给人类带来便利,但是这个结果并不一定是人类想要的。

好比,二战德国为了便利、加快杀 ...

细思极恐

出0入228汤圆

发表于 2020-3-23 19:46:20 来自手机 | 显示全部楼层
不可能的,现在的dna也许就是8bit.  真实人类也许有256bit

出0入0汤圆

发表于 2020-3-23 19:54:08 | 显示全部楼层
谁知道存储一个人(仅仅是一个人)的 完整DNA信息需要多少存储空间?

(DNA认证的 时候 设备是对比了多少bit才给出结论的 )

出140入158汤圆

发表于 2020-3-23 20:00:23 | 显示全部楼层
Edesigner. 发表于 2020-3-23 19:45
那对比匹配应该好快。每个省弄一台服务器。

1040P即可把全国人建个DNA库,不过真要建库,根本用不了这么多空间,因为实际上每个人的DNA相似度99.5%,只有0.5%的差异,1040P*0.005=5.2P,即是5200T,用现在常见的4T硬盘,只需要1300个硬盘即可。如果再压缩一下数据,按平均10%左右的压缩率(因为个体差异小,同种族差异更小,而且有规律),可能只需要130个4T硬盘就够了。

出140入158汤圆

发表于 2020-3-23 20:02:19 | 显示全部楼层
Edesigner. 发表于 2020-3-23 19:45
那对比匹配应该好快。每个省弄一台服务器。

测序慢,匹配是瞬间的事。

出0入442汤圆

发表于 2020-3-23 20:57:05 来自手机 | 显示全部楼层
aammoo 发表于 2020-3-23 18:00
全基因组测序,要分割,要有很多重合的部分,才能再拼回去,这样会有100G左右的数据
拼完了就剩3G的文本 ...

悬。人体的复杂度绝对不是几百mb能存下来的。

出0入0汤圆

发表于 2020-3-23 22:35:45 | 显示全部楼层
aammoo 发表于 2020-3-23 18:00
全基因组测序,要分割,要有很多重合的部分,才能再拼回去,这样会有100G左右的数据
拼完了就剩3G的文本 ...

所以人类基因组
是一份大约750MB的bin文件
不过如果你想研究C代码
就是100GB起步?

如果只允许使用汇编,且不能使用代码库
64K的汇编就够我把键盘敲烂

出0入0汤圆

发表于 2020-3-24 06:46:55 来自手机 | 显示全部楼层
现在难道是保存到纸上的?

出0入0汤圆

发表于 2020-3-24 08:17:28 | 显示全部楼层
1972年科学家发现:人类基因组中只有2%编码DNA,98%属于非编码序列(也就是无用编码)。
我理解2%编码是框架或是主程序(就如图片浏览器、视频播放器、文本编辑器),
余下98%的就是可被主程序使用的数据集(就如图片集,视频集,文本集)。

出0入90汤圆

发表于 2020-3-24 11:22:18 | 显示全部楼层
qq335702318 发表于 2020-3-23 22:35
所以人类基因组
是一份大约750MB的bin文件
不过如果你想研究C代码

C代码3G而已

出0入0汤圆

发表于 2020-3-24 12:34:34 | 显示全部楼层
现在难道是保存到纸上的?+1
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-24 00:01

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表