Browse

Data

201

Skills Found

#	Name	Author	Category	Stars	Score	BP
25	reading-dss-boundary-data 专门读取HEC-DSS文件（V6/V7）以提取水力建模所需的边界条件数据。自动化目录读取和时间序列提取，将DSS数据转换为带元数据的pandas DataFrame。需要Java JVM和pyjnius，采用延迟加载以在首次操作前最小化开销。	@gpt-cmdr	data	47	7.5	A
26	gtars 基于Rust的基因组区间分析工具包，提供Python绑定。处理BED文件、重叠检测、覆盖度分析和ML分词。包含命令行工具和API，支持片段处理和参考序列管理等计算基因组学工作流。	@K-Dense-AI	data	17.0k	8
27	networkx 该技能提供NetworkX Python库的访问，用于创建、分析和可视化网络图。包含构建图、运行最短路径和中心性等算法、生成合成网络以及使用matplotlib和交互式库创建可视化的示例。	@K-Dense-AI	data	17.0k	8.4
28	datacommons-client 提供访问Data Commons平台的Python客户端，该平台聚合了来自人口普查局、卫生组织等权威机构的公共统计数据。支持查询人口、经济、环境等时间序列数据，解析地理实体ID，并探索知识图谱关系。文档包含从名称解析到数据获取的完整工作流示例。	@K-Dense-AI	data	17.0k	8.5
29	seaborn 该技能提供使用Seaborn创建Python统计可视化的完整指南，涵盖函数和对象两种接口，解释不同图表类型的使用场景，包含EDA和出版级图形的实用模式。文档解决了常见故障排除场景，并与matplotlib良好集成。	@Microck	data	150	8.8
30	exploratory-data-analysis 该技能为化学、生物信息学、显微镜等领域的200多种科学文件格式提供自动化探索性数据分析。它能自动检测文件类型，提取特定格式的元数据，评估数据质量，并生成包含分析建议的详细Markdown报告。	@Microck	data	150	8.3
31	xlsx 该技能封装 xlsx 命令行工具，无需 Python 或 Node.js 即可操作 Excel 文件。提供类 SQL 过滤、单元格编辑、CSV 转换和基础分析。文档包含查看数据、搜索模式、更新单元格及数据提取等常见工作流的具体示例。	@lanej	data	37	8.4	B
32	mongodb-usage 该技能提供MongoDB查询和模式设计的最佳实践文档，涵盖嵌入与引用决策、ESR规则的索引策略、聚合管道优化和连接管理。技能为只读模式，专注于性能模式而非执行实际查询。	@fcakyon	data	559	7.2	B
33	xsv 该技能详细介绍了xsv这个基于Rust的高速CSV命令行工具包的使用方法。涵盖20多个命令，包括数据选择、过滤、统计、连接和排序操作。文档提供了实际示例、性能优化建议以及与其他Unix工具的集成模式。	@lanej	data	37	8.9	B
34	dask 提供Dask集成，用于扩展超出内存限制的pandas/NumPy工作流。包含DataFrames处理表格数据、Arrays处理数值运算、Bags处理非结构化数据。涵盖调度器选择、分块优化以及ETL管道和迭代算法等常见模式。	@K-Dense-AI	data	17.0k	8.3
35	pydicom 提供使用pydicom库处理DICOM医学影像文件的完整指南。涵盖文件读取、像素数据提取、元数据处理、格式转换、压缩解压和匿名化操作。包含安装说明、常见工作流代码示例以及压缩问题的解决方法。	@K-Dense-AI	data	17.1k	8.3
36	agentdb-optimization 为AgentDB向量数据库提供具体优化方案，包括量化方法（4-32倍内存压缩）、HNSW索引（150倍搜索加速）、缓存策略和批量操作。包含性能基准测试和配置示例。	@proffesor-for-testing	data	286	8.4	C

3/17