查看原文
其他

基因、光场与信息密码 | 邵晓鹏专栏第三季③

传承辟新的 中国激光杂志社 2024-05-19

作者 | 西安电子科技大学 邵晓鹏


序幕

一位幼儿园的老师拿着不同种类的苹果照片,问小朋友:这是什么?小朋友齐声回答:苹果!老师换成不同角度拍摄的苹果照片,继续问:这是什么?小朋友齐声回答:苹果!


第一幕
基因

宇宙的本质是信息。基因是信息遗传的密码,生物仅仅是基因的载体,它的生长代谢几乎都是受基因指令的控制。同时,我们又看到即使是同一受精卵繁衍出的双胞胎也存在着差异,也有人提出用爱因斯坦的基因复制出来一个人,放在今天他会不会成为历史上的那个爱因斯坦?显然,环境是影响生物体的另一重要因素。那么,基因是怎么携带信息的?基因与环境又是什么关系呢?

维基百科对基因的解释是:基因(英语:gene),在生物学中是指“携带遗传信息的基本物质单位”(基本遗传单位)。而自从确定遗传信息的分子载体为核酸后,基因即指能够遗传且具功能性的一段DNA或RNA序列,详细来说,其为DNA或RNA大分子内一段编码基因产物(RNA或蛋白质)合成的核苷酸序列。

基因的典型特点是能够把遗传密码传递给下一代。很明显的特点是同一家族的人面貌有相似之处,好的基因会遗传给下一代,坏的基因诸如暴力犯罪也会遗传,甚至某些遗传病也会一代接一代地传下去。

显然,基因是控制生物体生长的决定性因素,犹如程序代码一般,每一个基因密码都如同指令一般,精准地控制着复制的每一个过程。但基因与程序代码又存在着不同,程序代码每次执行的结果都是相同的,而基因在传递密码时却经常会发生错误,我们把这种错误称之为变异。

变异是经常发生的。有一种观点是早期的生物以RNA为遗传物质,最典型的是新冠病毒,它之所以变异那么快,就是因为RNA是单链的,复制过程中经常会发生错误,于是,就产生了变异。现在的生物大都是以DNA为遗传物质,其双螺旋结构犹如奇偶校验一般,复制错了马上纠正,保证遗传的稳定性。

尽管如此,遗传还是经常出现变异问题,影响因素很多,甚至有最新研究报道:男性DNA比女性的更容易出错,其中,影响最大的因素莫过于环境了。

既然变异,那么就应该有“好”的变异和“坏”的变异,好的变异多出现在我们吃的各种蔬菜水果中,比如耐虫、耐旱、耐寒等特征都会作为典型的“好”变异存留下来,大量播种遗留下来。当然,随着基因工程的发展,基因剪辑、基因重组等技术已日臻成熟,可以看到的是转基因产品随处可见,利用基因工程治疗癌症等技术也屡见不鲜。

基因的典型特点不仅具有家族性,甚至具有唯一性。家族性的特点很容易做族群的分析,研究人类迁徙历史和家族性疾病等;而唯一性特点可以很容易地从蛛丝马迹中寻找到个体,比如一根毛发即可找到嫌疑人。正因为如此,其家族性特点,恰恰可以作为分类的依据,据说中山靖王刘姓之后的基因压根没有刘邦基因系的影子;而唯一性的特点,恰恰就可以通过基因测序技术破案,得知哪个隔壁老王才是这个孩子真正的爹。


第二幕
光场

光子是神奇的,它独特的量子特性让科学家们一直争论不休。我们在这里不讨论单个光子的问题,把重点落在光场上。正如前文所言,计算成像的本质是光场信息的获取和解译,那么光场就是蕴含场景信息的载体,研究光场至关重要。

设想一个场景:在桌子上放置一个苹果,从早到晚,我们从不同角度拍,无论是窗户里投射过来的太阳光还是室内的灯光照射,只要有足够的曝光量,我们大概率能看出拍摄的是一个苹果而不是橘子。

对于苹果图像的认知问题,其实是两方面的因素:一是苹果自身的属性,无论它是什么颜色的,它的形状拓扑关系属性却是固有的,当然,咬一口尝尝更能立马分辨出来;二是我们在大脑中已经形成了苹果固有的属性,不仅有它的形状,而且有种类,甚至是味道。

但是,你能否从苹果的图像上判断出它是酸的还是甜的?糖分含量多少?有多少农药残留?有无内部腐烂?存放了多久?……这些答案其实很容易给出,那就是不能。为什么不能?因为苹果的图像仅仅给了我们有限的信息,我们能看出它的形状、颜色、大小,却无法判断上面那些问题。

那有没有可能通过计算成像回答上述问题呢?我们当然希望有答案,但不幸的是我们往往只能得到部分答案,比如糖分的含量兴许可以从光谱信息中找到蛛丝马迹,而腐烂的问题在偏振方面可能也会有所体现,而且,现实情况经常还会出现一种情况:即使已经知道了一些特征对应光学特性关系,但给出了实拍图依然还是找不到那些特征。当然,你可以把责任推给信噪比,但我认为信噪比却当了冤大头,不信的话,你把SORA中的扩散模型拿出来试试。

于是,另一个问题就来了:为何AI能做到的事情,我们还没办法找出其中的规律呢?这当然是一个过程问题,之前我多次就讲过:AI最擅长的是归纳,而不是演绎。在图像层面上,我们并不是什么特征因素都能提取和识别了,尤其是计算成像时代,这个图像其实是光场的记录,于是,就有更多蕴藏在光场中的特征有待发掘。

其实道理很简单,那是因为我们还是对光场的了解不够透彻,尤其是高维度光场,在对光与物质相互作用后表现出来的性质研究也不够全面、不够深入,造成了我们对图像特征理解的片面性,甚至出现即使单个物理量的图像特征,都还没有完全搞明白。一个典型的例子还是那个我经常提到的偏振成像,有人说它能穿云透雾,有人说它能攻克水下成像难题,有人说它能识别癌变细胞……但它到底能解决哪些问题,能解决到什么程度?至少目前,我们还很难找到很满意的答案。这当然涉及到了目标特性的问题,尽管国内外对此方面的研究已然很多,但与我们的需求还存在很大差距,尤其是缺乏系统性和多物理量融合性的研究,比如,你去问一个做偏振光谱成像的人:偏振高(多)光谱能干什么用?他大概率会回答:信息维度上升了,偏振和光谱能干的事儿它都能干,还能结合到一起用。你再问:结合起来能干什么?他的回答往往会语焉不详,憋了半天告诉你:在海面上有用,因为偏振能抑制光的反射,然后……云云。其实,他自己都没想清楚,这都是因为对目标特性理解地不够透彻的原因,所以,你做的仪器再好,也不一定能卖得出去。

我们还是回过头来看一下光场吧,它的基本要素有空间、时间、强度、偏振、光谱(色彩)、相位等,构成了我们试图用“视觉”来理解这个世界的基本元素。可是,对于成像而言,我们更关心的是如何用这些元素解决成像中的实际需求,也就是计算成像的范式设计,即把我们需要解决的分辨率、作用距离、深度和环境干扰等问题变成这些基本元素组合的问题。


第三幕
遗传密码

遗传密码(Genetic code)又称遗传编码,是遗传信息的传递规则,将DNA或mRNA序列以三个核苷酸为一组的“密码子(codon)”翻译为蛋白质的氨基酸序列,以用于蛋白质合成。一个生物体携带的遗传信息,即基因组,被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一连串单核苷酸组成。每个单核苷酸均由碱基、戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或停止信号。

因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码代表了长度为3个氨基酸的一段蛋白质序列。

上述名词对我们这些学物理的人感到头疼,但跳过那些陌生的名字,仔细分析却发现其实就是信息编码而已,似乎跟我们的二进制也没有太大区别,换个名字而已,而这恰恰就是信息的表达形式。

如果把遗传过程当成一种类似计算机运行程序的话,理论上来讲,按照遗传密码复制下来,相同基因的物种应该完全相同。可是,在自然界中我们难以找到两个完全相同的生物,更不用提双胞胎之间的“巨大”差异性了。这是因为变异的原因,即基因突变。当细胞分裂时遗传基因的复制发生错误、或受化学物质、基因毒性、辐射或病毒的影响,都会引起基因突变。显然,除了遗传“程序”运行不稳定的原因之外,环境起了重要的作用。


第四幕
光场信息密码

到底还是不是那个苹果?

光与物质作用后,光场中就会携带着物质的信息,信息密码就藏在光场之中。成像恰恰是获取这些信息最好的一种手段,但成像也仅仅是高维度光场向低维度投影的过程,于是就出现了信息的降维损失。这也就很容易解释一个人为何经常容易被烧水壶、茶杯、汤碗烫着的原因了,毕竟人只能看到可见光波段,而在红外波段却什么也看不到,于是被处于热红外波段特征显著的热水壶烫着也很正常,这就是在光谱维度上的降维。

我们经常提到一个词——高维度光场,它显得很抽象,因为像偏振这样的物理量,不仅人眼感受不到,而且还特别难理解,表示方法还特别多,甚至像穆勒矩阵中的一些分量至今还不能很好解释。那该怎么办?

别急,庖丁解牛,一点点来。我们还是从光场的基本要素开始解析。为了节省篇幅,我只挑光谱和偏振这两个典型的要素讲。

首先来看看光谱,这个被赋予了物质指纹这杆大旗的物理量,在成像方面着实让人又爱又恨。它的表示方法其实很简单,就是一条不同波段下光的反射/辐射强度曲线。理论上来讲,这条曲线越光滑、采样点越密、光谱宽度越宽,其光谱特征越完整,越容易被识别。可是,在设计光谱仪时却会受到光谱响应的限制,导致不同波段采用的探测器从材料到工艺都不一样,甚至像元尺寸也大小不同,更别说光学镜头的光谱普适性问题了。此时面临的严峻问题就是:能不能将光谱稀疏化,找出其特征光谱,然后设计成离散化的光谱片段,与遗传密码一般?其实,这就是多光谱相机设计的基础,用来指导光谱波段的选择问题。

图 多光谱与高光谱对比

然后我们再来看看偏振。光波偏振特性的表征有邦加球、Stokes、穆勒矩阵等方式,而这些方式本质上就是光波的偏振特性在不同维度上进行投影。目前,大家普遍认为穆勒矩阵是表征偏振最好的方式,因为它有很多参量,虽然目前还不能很好地去解释其中的一些参量,但总有一天,我们会发现其中蕴含的密码。而鉴于Stokes矢量对偏振特性测量的便利性和表达方式的简洁性,快速成为了偏振成像普遍采用的一种方法。Stokes矢量法仅仅是光场偏振信息的一种映射表示方法,会导致信息维度降低。而在偏振成像中,我们经常只采用线偏振模式,圆偏振长期缺席,自然也是信息维度降低。在偏振成像中,我们经常只采用线偏振模式,圆偏振长期缺席,自然也是信息维度降低。近年来,偏振成像多关注在解决透大气和水等散射介质、抑制反光、生物医学成像和三维成像等领域的问题,而对偏振目标特性的研究却不多。但是,我们知道偏振特性与物质的组成是密切相关的,也就是说,在理论上,偏振目标特性的显著性很明显,理应可以做物质判别,至少可以辅助吧。还有,偏振能够立体成像,三维形貌可增加一个相对深度信息,这无疑是给二维图像处理插上了一双翅膀。显然,我们对偏振特性的理解还远远不够。

图 传统拍照图像及偏振成像

接下来,我们看看光谱和偏振结合到一起会是什么样的呢?有人说:这其实就是赤兔马和拖拉机的组合,似乎“泡利不相容”。因为从传统的图像处理角度看,偏振多光谱成像给出来的就是分离出来的偏振图像序列和光谱图像序列,至于怎么用,不知道!这两个物理量怎么结合到一起,确实很难。其实,这种“结合”的说法本身就是错误,因为偏振和光谱是通过技术手段把它们从同一光场中分离出来的,本质上来讲,它们源于同一“基因”,只不过,如同同一基因控制,在不同器官长出不同细胞一般。那么,能不能对它们进行类似“基因剪辑”般的组合设计,在光谱和偏振两个维度空间上同时展开,而不是分别在光谱维和偏振维的一维空间比对它们的特征,当然是赤兔马和拖拉机的组合了!说白了,我们在单一维度物理空间做的事情很多,却很少去联合多个物理量融合做工作,尤其是深度研究物理量间的“基因”耦合关系。

图 富士胶片新开发的多光谱偏振相机系统

显然,高维度光场蕴含了很多的信息密码,虽然不能同基因的遗传密码一样简洁清晰地写成密码子的组合形式,但对于目标特性而言,追求类似密码子的表示方式,也许更能体现出其价值,更容易应用。科学的本质是简单,凡是复杂的,都不是最优的。类似“密码子”一样,以不同物理量数字化组合的方式表达光场信息,在形式上更符合现代计算机的处理模式,与大自然的统一性也更强。我认为,这会是今后很重要的一个研究方向,即目标特性的数字化表示。


第五幕
光场信息密码的变异

如同基因变异一样,光学成像特别容易受到环境的影响,这就给光场信息密码的传递带来了困难,有时犹如基本突变一般。如此一来,原先的光场信息密码将不能完整表达物体的特征,于是,物体的识别就成了问题。老赵的儿子长得越来越像隔壁老王,耿耿于怀的老赵恨不得去做一个基因识别。光场的问题也是如此,原先能辨别清楚的,现在不行了。

那么,如何去做变异后的密码溯源呢?光场信息密码的变异肯定有它的规律,看产生的原因:天气恶劣、大气扰动、强光干扰……这些都可以导致密码变异,甚至两个物体相互干扰严重时,也会产生变异。这也是为何实验室做的很好的目标特性实验,结果到实际环境中却变得一塌糊涂的原因。那好,变异后的密码不就是在原先的密码基础上加干扰项吗?没错,可是干扰项该怎么设计却是个大问题,最简单粗暴的做法是加噪声,当然结果肯定不理想。

其实,在很多的目标特性研究过程中,或多或少都会考虑这个干扰项的问题。如果变异原因也能写成“密码子”的形式,那么这个问题就会变得简单多了。当然,这需要换个思路去探索。


第六幕
记录

高维度光场信息的记录非常困难,目前为止,也没有看到把光场信息同时全部记录下来的案例。一个主要的原因是现有的探测器都是记录强度信息的,而很多物理量需要从强度信息中反演,于是,想在一个平面探测器上记录下多个物理量信息,就会出现信息混叠的情况,如全息图会把干涉条纹叠加到图像上;如果物理量太多的话,势必造成信息存储的损失问题。那该怎么办呢?

首先,全光场信息的记录对成像过程而言,全无必要!我们要的不是全部光场信息,而是重要的信息。那什么才是重要的信息?答案很简单:你最关心的那个!那好,重要信息必然要有它的信息密码,于是,我们就去看它的信息密码中到底包含了强度、偏振和光谱等哪些信息,根据这些信息,有目的地去设计成像范式。我们知道,成像范式设计受制的很大因素是探测器:平面、均匀采样、记录强度信息。想要更大的设计自由度,最好的办法是改变探测器,这恰恰是我们多年梦寐以求的愿望! 

图 基于光谱投影的新型颜色感知探测器

我之前的很多文章中都写过计算探测器的问题,对于未来探测器该如何设计,确实是个很重要也很难的问题。单从物理量上来看,既要有强度,还要有光谱和偏振等等,这些不同类型的像素该如何分布、设计多少个、设计成什么类型(比如波段宽度、偏振方向),怎么最大化利用不同类型的像素提升空间分辨率,这些都需要有一个指导思想。那么,指导思想是什么呢?答案当然是光场信息密码!

图 未来探测器畅想


尾声

一只巨大的虾蛄对着困着它的水族箱玻璃愤怒地出拳,只听见咣当一声,玻璃竟然被击穿,它逃逸了!

虾蛄(皮皮虾)从数亿年前存活到现在,是个奇迹;而且,据说从4亿年前,它就固执地停止了进化!虾蛄性情凶猛,视力十分锐利,但它看到的图像是什么样的?那么小的脑袋是如何解决这些复杂问题的?



下期预告

极简光学——单透镜可否“完美”成像?

对于光学系统设计而言,在考虑焦距、物距、像距、放大率、入瞳位置等光学特性和成像质量等因素后,往往需要更多的镜片协同工作,才能满足成像的需求。但这样的光学系统往往变得非常复杂,加工成本高、装调难度大。在计算成像时代,光学系统该怎么设计?如何达到极简优化设计?单透镜能“完美”成像吗?


作者团队简介

邵晓鹏,教授,西安电子科技大学光电工程学院院长,西安市计算成像重点实验室主任,173重点项目首席,科普作家。主要研究方向:计算光学成像技术、光电图像处理与模式识别、光电仪器研制与测试。现任国家部委专业组专家,中国光学工程学会常务理事、中国光学学会理事、陕西省光学学会副理事长、陕西省光学工程学会副理事长、西安市激光红外学会副理事长;光场调控及其系统集成应用福建省高校重点实验室学术委员会主任;国防工业光电信息控制和安全技术等10余个重点实验室学术委员会委员。Advanced Imaging主编,Ultrafast Science副主编,《应用光学》副主任委员,《激光与光电子学进展》《光学精密工程》《光子学报》《系统工程与电子技术》《数据采集》《光电技术应用》《激光与红外》《集成技术》《西安电子科技大学学报》等期刊编委。

相萌,准聘副教授,现工作于西安电子科技大学光电工程学院计算成像研究所。主要从事计算成像在空间遥感、工业检测、生物医学等典型交叉学科的应用研究,具体研究方向为光学合成孔径成像、傅里叶叠层超分辨成像等;近年来主持或参与了包括国家自然科学基金、JKW预研基金、高分辨率对地观测系统重大专项、重点实验室基金等国家及省部级纵/横向项目十余项。在Optics Letters、Frontiers in Physics等国内外重要学术期刊共发表SCI论文多篇,任Optics LettersApplied OpticsJOSA A等多个国际期刊审稿人。

张桐,准聘副教授,现工作于西安电子科技大学光电工程学院计算成像研究所。主要研究方向包括X射线断层成像技术和编码光谱成像技术。近年来参与了国家自然科学基金重点项目、面上项目及国家重点研发计划课题等项目研究,取得了多项具有重要学术意义和应用价值的研究成果。在Opt. Express、IEEE Trans. Comput. Imaging、IEEE Geosci. Remote Sens. Lett. 等国际重要学术期刊发表SCI论文6篇,申请/授权发明专利6项。

刘金鹏,副研究员,华山准聘副教授,硕士生导师,现工作于西安电子科技大学光电工程学院计算成像研究所。主要研究方向为强对抗环境下计算成像。近年来主持国家自然科学基金青年、国家重点项目子课题等多项国家及省部级项目,参与面上项目、863项目等课题。在散射成像、光场调控与分析等方面开展研究,并发表多篇OPTICS EXPRESSOPTICS LETTERS等SCI期刊论文,任Scientific ReportOPTICS EXPRESSApplied Optics等期刊审稿人。

郭成飞,副研究员,硕导。主要从事高通量、高空间带宽积计算显微成像、自动对焦技术以及自动显微仪器的应用开发等研究工作。主持某部委重点项目、国自然青年基金、博士后面上等项目,在Biosensors and Bioelectronics、ACS Photonics、Optics Letters、Optics Express等SCI期刊发表20余篇。

董雪,准聘副教授,主要从事基于微纳器件的光谱成像、散射光谱成像方面的基础研究与应用研究工作,提出了多种基于微纳器件的新型光谱成像方法、目标检测方法,开发了多套面向微观目标、宏观目标探测的小型化、高性能化系统样机。近年来参与了装备预研航天科技联合基金、基础研究学科布局项目、中央高校基本科研业务费专项资金等项目,在Microsystems & NanoengineeringOptics LettersOptics Express期刊上发表论文4篇,申请发明专利14项,授权5项。



End





首发前沿光学成果,放送新鲜光学活动

如需转载,请直接留言。

商务合作:季先生 18018304797

免责声明

本文中所出现的所有图片均为转载,如涉及版权等问题,请作者在20个工作日之内来电或来函联系,我们将协调给予处理(按照法规支付稿费或删除)。

最终解释权归《中国激光》杂志社所有
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存