Main Site ↗

Browse

Data

201

Skills Found

#NameStarsScore
25
reading-dss-boundary-data
专门读取HEC-DSS文件(V6/V7)以提取水力建模所需的边界条件数据。自动化目录读取和时间序列提取,将DSS数据转换为带元数据的pandas DataFrame。需要Java JVM和pyjnius,采用延迟加载以在首次操作前最小化开销。
477.5
26
gtars
基于Rust的基因组区间分析工具包,提供Python绑定。处理BED文件、重叠检测、覆盖度分析和ML分词。包含命令行工具和API,支持片段处理和参考序列管理等计算基因组学工作流。
17.0k8
27
networkx
该技能提供NetworkX Python库的访问,用于创建、分析和可视化网络图。包含构建图、运行最短路径和中心性等算法、生成合成网络以及使用matplotlib和交互式库创建可视化的示例。
17.0k8.4
28
datacommons-client
提供访问Data Commons平台的Python客户端,该平台聚合了来自人口普查局、卫生组织等权威机构的公共统计数据。支持查询人口、经济、环境等时间序列数据,解析地理实体ID,并探索知识图谱关系。文档包含从名称解析到数据获取的完整工作流示例。
17.0k8.5
29
seaborn
该技能提供使用Seaborn创建Python统计可视化的完整指南,涵盖函数和对象两种接口,解释不同图表类型的使用场景,包含EDA和出版级图形的实用模式。文档解决了常见故障排除场景,并与matplotlib良好集成。
1508.8
30
exploratory-data-analysis
该技能为化学、生物信息学、显微镜等领域的200多种科学文件格式提供自动化探索性数据分析。它能自动检测文件类型,提取特定格式的元数据,评估数据质量,并生成包含分析建议的详细Markdown报告。
1508.3
31
xlsx
该技能封装 xlsx 命令行工具,无需 Python 或 Node.js 即可操作 Excel 文件。提供类 SQL 过滤、单元格编辑、CSV 转换和基础分析。文档包含查看数据、搜索模式、更新单元格及数据提取等常见工作流的具体示例。
378.4
32
mongodb-usage
该技能提供MongoDB查询和模式设计的最佳实践文档,涵盖嵌入与引用决策、ESR规则的索引策略、聚合管道优化和连接管理。技能为只读模式,专注于性能模式而非执行实际查询。
5597.2
33
xsv
该技能详细介绍了xsv这个基于Rust的高速CSV命令行工具包的使用方法。涵盖20多个命令,包括数据选择、过滤、统计、连接和排序操作。文档提供了实际示例、性能优化建议以及与其他Unix工具的集成模式。
378.9
34
dask
提供Dask集成,用于扩展超出内存限制的pandas/NumPy工作流。包含DataFrames处理表格数据、Arrays处理数值运算、Bags处理非结构化数据。涵盖调度器选择、分块优化以及ETL管道和迭代算法等常见模式。
17.0k8.3
35
pydicom
提供使用pydicom库处理DICOM医学影像文件的完整指南。涵盖文件读取、像素数据提取、元数据处理、格式转换、压缩解压和匿名化操作。包含安装说明、常见工作流代码示例以及压缩问题的解决方法。
17.1k8.3
36
agentdb-optimization
为AgentDB向量数据库提供具体优化方案,包括量化方法(4-32倍内存压缩)、HNSW索引(150倍搜索加速)、缓存策略和批量操作。包含性能基准测试和配置示例。
2868.4