熨斗的软件
我们正在构建一个“天体测量引擎”,为每一张有用的天文图像(过去和未来)创建正确的、符合标准的天体测量元数据,无论存档处于何种混乱状态。天体测量引擎将接收任何图像并返回天体测量世界坐标系(WCS)——即,图像坐标和天空坐标之间(通常是非线性的)转换的基于标准的描述——绝对没有“假阳性”(但可能有一些“没有答案”)。即使输入图像的元数据没有错误或完全错误,它也会尽其所能。我们打算在网上、天文台、车牌扫描项目和数据档案上安装实时操作的引擎。
大规模钙成像数据分析的计算工具箱。该代码实现了CNMF算法,用于从大规模钙成像电影中同步提取源和尖峰推断。包括更多的功能。该代码适用于体细胞成像数据的分析。未来还将增加树枝状/轴突成像数据分析的改进实现。
大规模钙成像数据分析的计算工具箱。该代码实现了CNMF算法,用于从大规模钙成像电影中同步提取源和尖峰推断。包括更多的功能。该代码适用于体细胞成像数据的分析。未来还将增加树枝状/轴突成像数据分析的改进实现。
现代成像方法,如光、电子和同步x射线,使大样本的3D成像具有高分辨率。因此,产生了越来越多的太字节级甚至拍字节级的图像卷。在单台计算机上运行的传统软件已经无法处理它们,分布式计算,特别是云计算通常是首选。同时,由于科学任务的多样性,图像处理管道也存在着多样性,而它们内部通常有一些共同的操作。Chunkflow就是为了应对这些挑战而设计的。图像卷被分解为块,并分布在计算节点之间。得益于混合云架构设计,用户可以在cpu和gpu同时使用本地集群和公共云运行任务。目前,可以在命令行中组合50多个操作符,以立即构建定制的管道。用户还可以轻松地插入自己的Python代码作为新操作符。Chunkflow是在实际项目中构建的,已经用于产生超过18 pb的结果卷。 The maximum scale we have reached is over 3300 instances with GPUs in Google Cloud across three regions, and Chunkflow is still robust and reliable.
快速sinc转换库,它计算sinc和sinc2核在1、2或3维的N个任意点之间的和。这在MRI和带限函数近似中有应用。朴素代价是O(N2),而我们的算法是n的准线性。
基于fft加速插值的t-SNE (FIt-SNE)是t-SNE(随机邻域嵌入)的有效实现,用于高维数据集的降维和可视化。该代码能够在桌面上不到2分钟的时间内对100万个数据点执行1000次t-SNE迭代,比任何其他现有代码都快很多倍。由耶鲁大学的Manas rach合著。
Kachery-cloud是一个用于在实验室计算机和基于浏览器的用户界面之间共享科学数据文件、实时提要、可变数据和计算结果的网络。资源被组织成通过注册的Python客户端访问的项目。使用简单的Python命令,您可以存储文件、数据对象、可变变量或实时提要,然后通过引用通用URI字符串在远程机器上(或通过JavaScript在浏览器中)检索或访问这些文件。在静态内容的情况下,uri本质上是内容散列,因此形成了一个可寻址的内容存储数据库。虽然目前kachery-cloud的主要目的是支持figurl,但它也可以独立地用于协同科学研究工作流程,并提高科学的可重复性和传播性。
该服务器在硅纳米解剖中执行,这是我们开发的一种方法,用于识别具有新细胞谱系特异性表达的基因。该方法利用来自组织匀浆的高通量功能基因组学数据,准确预测在特定细胞类型中富集的基因。
由于神经元和血管的弦状性质,它们可以抽象为具有中心线和半径的曲线管。这种表示方法可用于路径长度和分支角度等形态学分析。在对体素进行精确分割的前提下,计算物体中心线和半径称为骨架化。RealNeuralNetworks.jlis developed to do that. Unlike most related packages, it combines the synaptic connectivity graph with morphological features and could be used to explore the relationship between synaptic connectivity and morphology. Recently, a new arising programing language, called Julia, is getting popular in data science. RealNeuralNetworks.jl is a Julia package and the algorithms are written from scratch for less dependency and efficiency.
Sleipnir是一个c++库,能够对基因组数据进行高效的分析、集成、挖掘和机器学习。这包括对微阵列的特别关注,因为它们构成了许多生物体的大量可用数据,但Sleipnir还可以集成各种各样的其他数据类型,从成对的物理相互作用到序列相似性或共享的转录因子结合位点。所有的分析都注意速度和内存的使用,使涵盖数万个基因的数百个数据集集成成为可能。除了核心库之外,Sleipnir还提供了各种预先制作的工具,为常见的数据处理任务和示例提供解决方案,以帮助您在自己的程序中使用Sleipnir。Sleipnir是免费的、开源的、完整的文档化的,可以单独使用,也可以作为计算生物学分析中的一个组件。