管理脚本目录
管理脚本目录
📋 脚本概述
本目录包含 Ribocentre-Aptamer 项目的所有管理和维护脚本,涵盖数据管理、分析处理、资源优化等功能。
🔧 核心管理脚本
1. 统一适配体管理 (manage_aptamers.py
)
功能: 统一管理有3D和无3D结构的适配体数据
主要特性:
- 支持两种类型适配体的统一管理
- 命令行界面简化操作
- 自动数据验证和备份
- 分类系统自动管理
基本用法:
# 查看系统统计
python scripts/manage_aptamers.py stats
# 验证所有数据
python scripts/manage_aptamers.py validate
详细命令:
有3D结构适配体操作
# 添加新适配体
python scripts/manage_aptamers.py add-3d "适配体名称" "链接URL" "分类名称"
# 更新现有适配体
python scripts/manage_aptamers.py update-3d "旧名称" --name "新名称" --category "新分类"
# 列出所有适配体
python scripts/manage_aptamers.py list-3d
# 按分类筛选
python scripts/manage_aptamers.py list-3d --category "Fluorescent Aptamers"
# 查看可用分类
python scripts/manage_aptamers.py categories-3d
无3D结构适配体操作
# 添加新适配体
python scripts/manage_aptamers.py add-no3d "适配体名称" "链接URL" "分类名称"
# 更新现有适配体
python scripts/manage_aptamers.py update-no3d "旧名称" --name "新名称" --category "新分类"
# 列出所有适配体
python scripts/manage_aptamers.py list-no3d
# 按分类筛选
python scripts/manage_aptamers.py list-no3d --category "Proteins"
# 查看可用分类
python scripts/manage_aptamers.py categories-no3d
2. 单独适配体管理 (add_aptamer.py
)
功能: 专门管理无3D结构适配体(向后兼容)
适用场景:
- 只需要管理无3D结构适配体
- 保持旧工作流程的兼容性
- 简化的操作界面
使用方法:
# 添加新适配体
python scripts/add_aptamer.py add "适配体名称" "链接URL" "分类名称"
# 更新适配体信息
python scripts/add_aptamer.py update "旧名称" --name "新名称" --category "新分类" --link "新链接"
# 删除适配体
python scripts/add_aptamer.py delete "适配体名称"
# 列出所有适配体
python scripts/add_aptamer.py list
# 按分类筛选
python scripts/add_aptamer.py list --category "Proteins"
# 验证数据完整性
python scripts/add_aptamer.py validate
# 查看所有可用分类
python scripts/add_aptamer.py categories
📊 数据处理脚本
3. 序列数据更新脚本
update_post_tags_from_sequence_json.py
功能: 从序列JSON文件更新文章标签
python scripts/update_post_tags_from_sequence_json.py
update_post_tags_from_sequence_json_fixed.py
功能: 修复版本的序列标签更新脚本
python scripts/update_post_tags_from_sequence_json_fixed.py
4. 荧光数据增强 (add_more_info_to_fluorescence_json.py
)
功能: 为荧光适配体数据添加详细信息
特性:
- 自动分析荧光适配体属性
- 添加结构和功能信息
- 增强数据完整性
python scripts/add_more_info_to_fluorescence_json.py
5. 链接器管理 (add_linker_to_json.py
)
功能: 为JSON数据添加链接器信息
应用场景:
- 建立适配体之间的关联
- 添加参考链接
- 完善数据结构
python scripts/add_linker_to_json.py
🔍 数据分析脚本
6. 结果分析工具
analyze_matching_results.py
功能: 分析匹配结果数据
python scripts/analyze_matching_results.py
- 统计匹配成功率
- 分析数据质量
- 生成分析报告
generate_keyword_freq.py
功能: 生成关键词频率统计
python scripts/generate_keyword_freq.py
- 分析文档关键词分布
- 生成词频统计
- 支持搜索优化
7. 结构数据处理
parse_structures.py
功能: 解析结构数据文件
python scripts/parse_structures.py
- 处理PDB结构文件
- 提取结构信息
- 标准化数据格式
extract_refs.py
功能: 提取参考文献信息
python scripts/extract_refs.py
- 从文档中提取引用
- 格式化参考文献
- 建立引用数据库
🧹 数据清理脚本
8. Excel数据处理 (excel_cleaner.py
)
功能: 清理和标准化Excel数据
处理内容:
- 去除空行和无效数据
- 标准化数据格式
- 修复数据错误
python scripts/excel_cleaner.py
9. 数据标准化工具
round_gc_content.py
功能: 对GC含量进行四舍五入处理
python scripts/round_gc_content.py
check_linker_validity.py
功能: 检查链接器数据的有效性
python scripts/check_linker_validity.py
jsonmerge.py
功能: 合并多个JSON文件
python scripts/jsonmerge.py
10. 其他工具脚本
extractApplications.py
功能: 提取应用信息数据
python scripts/extractApplications.py
temp_phase_replace.py
功能: 临时阶段替换工具
python scripts/temp_phase_replace.py
tiquluzhizhongdewenbenchaoianjie.py
功能: 特定文本处理工具
python scripts/tiquluzhizhongdewenbenchaoianjie.py
🌐 外部API集成
11. PubMed API集成 (pubmed_api_updater.py
)
功能: 自动更新PubMed文献信息
特性:
- 自动获取最新文献数据
- 更新引用信息
- 同步PubMed数据库
python scripts/pubmed_api_updater.py
配置说明:
- 需要PubMed API密钥
- 支持批量更新
- 自动错误处理和重试
⚡ 前端资源优化
12. JavaScript压缩 (minify-js.js
)
功能: 压缩JavaScript文件以提高性能
特性:
- 使用UglifyJS进行压缩
- 保留关键注释
- 生成source map
node scripts/minify-js.js
13. CSS压缩 (minify-css.js
)
功能: 压缩CSS文件
特性:
- 移除冗余代码
- 优化选择器
- 减少文件大小
node scripts/minify-css.js
14. 压缩效果测试 (test-minification.js
)
功能: 测试和验证压缩效果
node scripts/test-minification.js
📋 脚本分类索引
按功能分类
🎯 核心管理
manage_aptamers.py
- 统一适配体管理add_aptamer.py
- 单独适配体管理
📊 数据处理
update_post_tags_from_sequence_json.py
- 序列标签更新add_more_info_to_fluorescence_json.py
- 荧光数据增强add_linker_to_json.py
- 链接器添加
🔍 分析工具
analyze_matching_results.py
- 结果分析generate_keyword_freq.py
- 关键词分析parse_structures.py
- 结构解析extract_refs.py
- 文献提取
🧹 数据清理
excel_cleaner.py
- Excel清理round_gc_content.py
- GC含量标准化check_linker_validity.py
- 链接器验证jsonmerge.py
- JSON合并
🌐 外部集成
pubmed_api_updater.py
- PubMed API
⚡ 性能优化
minify-js.js
- JavaScript压缩minify-css.js
- CSS压缩test-minification.js
- 压缩测试
按编程语言分类
Python脚本 (18个)
- 数据管理和处理的主力工具
- 完整的命令行界面
- 丰富的数据验证功能
JavaScript脚本 (3个)
- 前端资源优化
- 构建和部署工具
- 性能测试工具
🚀 使用指南
新手快速上手
- 基础操作: 从
manage_aptamers.py
开始 - 查看帮助: 使用
--help
参数查看详细说明 - 验证数据: 操作前后都要运行
validate
命令
日常维护流程
# 1. 检查当前状态
python scripts/manage_aptamers.py stats
# 2. 执行必要的操作
python scripts/manage_aptamers.py add-3d "新适配体" "链接" "分类"
# 3. 验证数据完整性
python scripts/manage_aptamers.py validate
# 4. 更新前端资源(如需要)
node scripts/minify-js.js
node scripts/minify-css.js
故障排除
常见问题
- 权限错误: 确保脚本有执行权限
- 依赖缺失: 检查Python/Node.js依赖
- 数据冲突: 使用验证命令检查数据完整性
调试技巧
# 查看脚本详细输出
python scripts/manage_aptamers.py --verbose
# 使用调试模式
python -m pdb scripts/manage_aptamers.py
# 检查脚本语法
python -m py_compile scripts/manage_aptamers.py
📦 依赖管理
Python依赖
主要依赖包括:
json
- JSON数据处理pathlib
- 文件路径处理argparse
- 命令行参数解析collections
- 数据结构扩展
Node.js依赖
主要依赖包括:
uglify-js
- JavaScript压缩clean-css
- CSS压缩fs
- 文件系统操作
安装依赖
# Python依赖(标准库,通常无需额外安装)
python -m pip install --upgrade pip
# Node.js依赖
npm install uglify-js clean-css-cli
🔒 安全注意事项
数据备份
所有修改数据的脚本都会:
- 自动创建备份文件
- 保留原始数据副本
- 提供回滚机制
权限控制
- 脚本只修改指定的数据文件
- 不会访问系统敏感目录
- 提供操作日志记录
📝 开发指南
添加新脚本
- 创建新的脚本文件
- 添加详细的文档注释
- 实现命令行参数解析
- 提供帮助信息
- 更新本README文档
代码规范
- 使用有意义的变量名
- 添加详细的注释
- 实现错误处理
- 提供使用示例
🔗 相关链接
- 技术文档:
../doc/README.md
- 项目主文档:
../PROJECT_DOCUMENTATION.md
- 在线版本: Ribocentre-Aptamer
本脚本集合提供了完整的项目管理工具链,涵盖数据管理、分析处理、性能优化等各个方面。
最后更新: 2024年12月