Prism10引入全新的文件格式,释放Prism文件的巨大潜力-无论是在应用程序内部还是外部-同时确保从使用Prism旧文件格式到使用Prism新文件格式的无缝过渡。本文旨在介绍我们决定引入新文件格式的理念和动机,并提供一些关于新文件格式组织方式和浏览(如果您选择)方式的技术细节!
新文件格式的理念和动机
更开放,更容易访问
Prism文件包含大量关于工作的有用信息:从原始数据,到选择的分析选项和后续结果,再到创建的自定义图表。但归根结底,这都是您的工作。我们认为您应该始终可以完全访问自己的工作。这是引入新prism文件格式的主要动机之一,这样可以更方便地在文件本身中访问这些资源。
从根本上说,新Prism文件格式有哪些变化?首先也是最重要的是,文件的内容不再隐藏或掩盖在专有格式后面。相反,新Prism文件格式中的所有内容均存储在可以充分浏览和举例的结构中(新Prism文件的操作方式很像zip文件)。此外,我们选择使用行业标准方法来存储文件的各组成部分:以CSV格式存储数据,以PNG格式存储图形预览图像,以标准JSON图式存储所有分析参数和结果。最终,这意味着不会把任何内容锁定在只有使用Prism才能访问的文件中。相反:采用新文件格式后可以使用第三方工具以手动和编程两种方式浏览文件内容。
透明度是关键
验证科学成果是任何研究项目的关键组成部分。这通常意味着使用相同的实验条件、相同的数据收集方法、相同的分析程序重现相同的结果,重新创建或重复已执行的工作。遗憾的是,无法重现结果(尤其是在生物学、生物化学和生物医学研究中)已成为一个普遍问题,称为“再现性危机”。重要的是,该问题往往与结果是否“正确”无关。而是在于数据收集和分析方法缺乏透明度。如果信息不可用或不完整,即使实验过程的微小变化也会导致结果显著不同(因而不可重现)。这是选择将Prism转换为更开放的文件格式的另一原因:每个分析的每个选定选项均可以与每个参数和计算的分析结果一起使用。从输入数据到最终结果和可视化,Prism文件将为分析工作提供清晰的脉络。
信奉公平的意识形态
2016年,一篇题为“科学数据管理和监督的公平指导原则”的文章发表在《自然》的科学数据杂志上,介绍了公平数据原则的概念。这些原则的目的是提高科学数据的可查找性、可访问性、可互操作性和可重用性,这反过来又有助于提高利用数据开展的任何工作的重现性。在向新文件格式过渡的过程中,我们接受了许多公平意识形态。Prism文件的任何组成部分(数据、分析参数或结果或图表)均可以位于文件结构中,且可以以任何所需的后续方式重用。使用行业标准格式(CSV、PNG、JSON等)可以确保即使在Prism之外也可以使用这些资产。
对于我现有的工作,会有什么改变?
无论您是刚开始使用Prism还是已经使用几十年,我们都知道保留访问结果权限的重要性(毕竟,这是我们最初选择转移到新文件格式的原因!)。因此,我们绝对不希望您无法访问以旧版文件格式(扩展名为.pzfx或.pzf的文件)生成的任何Prism文件。但我们也想确保引入新文件格式时尽可能做到无缝衔接。
这便是在Prism10中引入“兼容模式”的原因。本质上,Prism10允许在兼容模式下打开旧格式的文件,而不会出现警告或提示。在兼容模式下打开不会有限制:仍可访问Prism10提供的所有内容。重要的是,选择保存文件时,Prism将自动检查以确保文件仍与其现有的文件格式兼容。如无兼容性问题,Prism将按照您的期望简单地保存文件。如果任何新功能或特性与旧文件格式不兼容,则Prism将列出这些问题,提供如何继续操作的选项(包括以新prism文件格式保存文件)。这些变化确保可以无缝地过渡到使用新文件格式,而不用担心现有的所有工作会发生什么变化。
关于新文件格式的一些基本技术细节
使用“.prism”文件扩展名的新Prism文件格式实际上集合了许多单独的文件夹和文件,像zip文件一样压缩和存档。组成.prism文件中对象集合的各个文件表示整个项目的不同组件:例如,原始数据、图表、分析参数、分析结果等。此外,.prism文件包含可用于(手动或编程)查找项目相关部分的元数据。
手动浏览.prism文件,可以先将文件扩展名从.prism改为.zip(警告:在继续之前,可能需要创建一份文件副本,以防意外更改或修改文件的某些组件)。
将文件扩展名改为.zip后,双击文件就可以解压缩文件内容。注:这通常会创建一个包含文件所有内容的新文件夹。打开文件夹即可查看这些内容。对于以下示例,您也可以选择使用以下示范文件。
浏览采用新文件格式的文件内容时,建议从“document.json”文件开始。其位于内容的顶层,作为查找文件任何其他组件的起点。重要的是,“工作表”部分列出了Prism项目文件中每个工作表的唯一标识符(UID),按工作表类型(数据、分析结果、图表、布局、项目信息)分组。UID一开始看起来很复杂,但只是确保Prism文件中每个对象均可以唯一标识的方法,同一文件中的任何两个对象均均不会有重复的UID。Prism文件中每个工作表的标题见“sheetAttributesMap“部分,使用与“工作表”部分相同的UID。
查找数据
Prism数据表中的数据存储为.csv文件。查找csv文件时,首先识别工作表UID(使用document.json文件的“sheetAttributesMap”和“工作表”部分)。本例中的UID是D2BA2BA5-E5D3-4123-BEB0-EE8E83A725B9。找到UID后,打开“数据”文件夹,然后打开“工作表”文件夹。在此找到具有对应UID的文件夹并打开。
此文件夹包含一份名为“sheet.json”的文件。在此文件中,有一个名为“表格”的部分包含另一个UID。本例中的表格UID是41482C82-CAB8-4E5C-AA4E-0F3AECC50B71。使用此新UID,返回“数据”文件夹,打开“tables”文件夹。在此找到具有对应UID的文件夹并打开。此文件夹将包含一份名为“data.csv”的文件,该文件包含存储在Prism数据表中的原始值。
查找图表
查找特定图表时,首先识别工作表UID(使用document.json文件的“sheetAttributesMap”和“工作表”部分)。本例中的UID是C0350155-E0F6-407F-9DB9-FDE70CA6BC29。找到UID后,打开“图表”文件夹,找到具有对应UID的文件夹(在此情况下,只有一个图表,所以很简单)。
在此文件夹中,可以找到一份名为“preview.png”的文件。这是您自定义的图表的图像文件。请注意,只有在应用程序中查看过的图表才会有“preview.png”文件(Prism不会为尚未在应用程序中查看过的图表创建预览)。
查找结果
Prism存储分析结果的方式有两种:
将识别为结果工作表的表格“视图”
分析生成的完整“原始”结果,用于填充结果工作表
可以用类似的方式查找其中的任何一个。首先识别工作表UID(使用document.json文件的“sheetAttributesMap”和“工作表”部分)。本例中的非线性回归分析UID是0D9656DF-9344-4539-B718-EC3D7BFEC43E。找到UID后,打开“分析”文件夹,找到具有对应UID的文件夹(在此情况下,只有一项分析,所以很简单)。
在此文件夹中,可以找到一份名为“results.json”的文件。这是分析的“原始”结果,其数值以尽可能多的小数存储在特定于每个分析的JSON模式中。
查找PrismUI中显示的表格“视图”时,还需要额外一些步骤。首先,打开文件“sheet.json”。“resultSheets”部分列出了结果的每个选项卡(可见和隐藏)及其UID。在本例中,我们希望看到“结果表格”,因此希望使用UID1CC9F339-0217-4AD5-92EC-C610EE86ECAC。找到UID后,打开“result_sheets”文件夹,找到具有对应UID的文件。
此文件将有一个名为“数据表”的部分,其中包含另一个UID。本例中的UID是9B99432B-6CEC-4C91-A7A0-C167DFC6C466。使用此UID,一直返回到文件夹的根目录(顶层)(document.json所在的位置),找到“数据”文件夹。打开,然后打开“工作表”文件夹。在此找到具有对应UID的文件夹并打开。
此文件夹包含一份名为“sheet.json”的文件。在此文件中,有一个名为“表格”的部分包含另一个UID。本例中的表格UID是D1815795-1D83-4A99-B5FB-7B4B32467F70。使用此新UID,返回“数据”文件夹,打开“tables”文件夹。在此找到具有对应UID的文件夹并打开。此文件夹将包含一份名为“data.csv”的文件,其中包含Prism表格视图中显示的结果。
上一条:通过实现可视化取得成功:利用Minitab的图形功能来优化库存
下一条:erwin什么是数据映射?