На этой странице Шлюз к 400+ биоинформатическим навыкам из bioSkills и ClawBio. Охватывает геномику, транскриптомику, одноклеточный анализ, поиск вариантов, фармакогеномику, метагеномику, структурную биологию и многое другое. Запрашивает профильные справочные материалы по требованию.
Метаданные навыка¶
| |
|---|---
|Источник| Опционально — установка: hermes skills install official/research/bioinformatics
|Путь| optional-skills/research/bioinformatics
|Версия| 1.0.0
|Платформы| linux, macos
|Теги| bioinformatics, genomics, sequencing, biology, research, science
Справочно: полный SKILL.md¶
info Ниже приведено полное описание навыка, которое Hermes загружает при его активации. Это инструкции, которые видит агент, когда навык активен.
Шлюз биоинформатических навыков¶
Используйте, когда запрос касается биоинформатики, геномики, секвенирования, поиска вариантов, экспрессии генов, одноклеточного анализа, структуры белков, фармакогеномики, метагеномики, филогенетики или любой вычислительной биологии. Этот навык является шлюзом к двум библиотекам биоинформатических навыков с открытым исходным кодом. Вместо того чтобы включать сотни профильных навыков, он индексирует их и загружает необходимое по требованию.
Источники¶
◆ bioSkills — 385 справочных навыков (шаблоны кода, руководства по параметрам, деревья решений) Репозиторий: https://github.com/GPTomics/bioSkills Формат: SKILL.md по каждой теме с примерами кода. Python/R/CLI. ◆ ClawBio — 33 запускаемых пайплайна (исполняемые скрипты, пакеты воспроизводимости) Репозиторий: https://github.com/ClawBio/ClawBio Формат: Python-скрипты с демонстрациями. Каждый анализ экспортирует report.md + commands.sh + environment.yml.
Как загрузить и использовать навык¶
- Определите домен и название навыка из указателя ниже.
- Клонируйте соответствующий репозиторий (поверхностное клонирование для экономии времени):
[code] # bioSkills (справочные материалы)
git clone --depth 1 https://github.com/GPTomics/bioSkills.git /tmp/bioSkills# ClawBio (запускаемые пайплайны) git clone --depth 1 https://github.com/ClawBio/ClawBio.git /tmp/ClawBio
[/code]
3. Прочитайте конкретный навык:
[code] # bioSkills — каждый навык находится по пути:
cat /tmp/bioSkills/variant-calling/gatk-variant-calling/SKILL.md
# ClawBio — каждый навык находится по пути: skills/<skill-name>/
cat /tmp/ClawBio/skills/pharmgx-reporter/README.md
[/code] 4. Используйте загруженный навык как справочный материал. Эти навыки НЕ в формате SKILL.md для Hermes — у них своя структура. Воспринимайте их как экспертные руководства по домену. Они содержат правильные параметры, корректные флаги инструментов и проверенные пайплайны.
Указатель навыков по доменам¶
Основы работы с последовательностями¶
bioSkills: sequence-io/ — read-sequences, write-sequences, format-conversion, batch-processing, compressed-files, fastq-quality, filter-sequences, paired-end-fastq, sequence-statistics sequence-manipulation/ — seq-objects, reverse-complement, transcription-translation, motif-search, codon-usage, sequence-properties, sequence-slicing ClawBio: seq-wrangler — Контроль качества последовательностей, выравнивание и обработка BAM (обёртка FastQC, BWA, SAMtools)
Контроль качества чтений и выравнивание¶
bioSkills: read-qc/ — quality-reports, fastp-workflow, adapter-trimming, quality-filtering, umi-processing, contamination-screening, rnaseq-qc read-alignment/ — bwa-alignment, star-alignment, hisat2-alignment, bowtie2-alignment alignment-files/ — sam-bam-basics, alignment-sorting, alignment-filtering, bam-statistics, duplicate-handling, pileup-generation
Поиск вариантов и аннотация¶
bioSkills: variant-calling/ — gatk-variant-calling, deepvariant, variant-calling (bcftools), joint-calling, structural-variant-calling, filtering-best-practices, variant-annotation, variant-normalization, vcf-basics, vcf-manipulation, vcf-statistics, consensus-sequences, clinical-interpretation ClawBio: vcf-annotator — Аннотация VEP + ClinVar + gnomAD с учётом популяционного контекста variant-annotation — Пайплайн аннотации вариантов
Дифференциальная экспрессия (Bulk RNA-seq)¶
bioSkills: differential-expression/ — deseq2-basics, edger-basics, batch-correction, de-results, de-visualization, timeseries-de rna-quantification/ — alignment-free-quant (Salmon/kallisto), featurecounts-counting, tximport-workflow, count-matrix-qc expression-matrix/ — counts-ingest, gene-id-mapping, metadata-joins, sparse-handling ClawBio: rnaseq-de — Полный пайплайн DE с контролем качества, нормализацией и визуализацией diff-visualizer — Расширенная визуализация и отчётность для результатов DE
Одноклеточный RNA-seq¶
bioSkills: single-cell/ — preprocessing, clustering, batch-integration, cell-annotation, cell-communication, doublet-detection, markers-annotation, trajectory-inference, multimodal-integration, perturb-seq, scatac-analysis, lineage-tracing, metabolite-communication, data-io ClawBio: scrna-orchestrator — Полный пайплайн Scanpy (QC, кластеризация, маркеры, аннотация) scrna-embedding — Латентное представление и интеграция партий на основе scVI
Пространственная транскриптомика¶
bioSkills: spatial-transcriptomics/ — spatial-data-io, spatial-preprocessing, spatial-domains, spatial-deconvolution, spatial-communication, spatial-neighbors, spatial-statistics, spatial-visualization, spatial-multiomics, spatial-proteomics, image-analysis
Эпигеномика¶
bioSkills: chip-seq/ — peak-calling, differential-binding, motif-analysis, peak-annotation, chipseq-qc, chipseq-visualization, super-enhancers atac-seq/ — atac-peak-calling, atac-qc, differential-accessibility, footprinting, motif-deviation, nucleosome-positioning methylation-analysis/ — bismark-alignment, methylation-calling, dmr-detection, methylkit-analysis hi-c-analysis/ — hic-data-io, tad-detection, loop-calling, compartment-analysis, contact-pairs, matrix-operations, hic-visualization, hic-differential ClawBio: methylation-clock — Оценка эпигенетического возраста
Фармакогеномика и клинические данные¶
bioSkills: clinical-databases/ — clinvar-lookup, gnomad-frequencies, dbsnp-queries, pharmacogenomics, polygenic-risk, hla-typing, variant-prioritization, somatic-signatures, tumor-mutational-burden, myvariant-queries ClawBio: pharmgx-reporter — Отчёт PGx из данных 23andMe/AncestryDNA (12 генов, 31 SNP, 51 препарат) drug-photo — Фото лекарства → персонализированная карточка дозировки PGx (через vision) clinpgx — API ClinPGx для данных ген-препарат и руководств CPIC gwas-lookup — Федеративный поиск вариантов по 9 геномным базам данных gwas-prs — Полигенные баллы риска из потребительских генетических данных nutrigx_advisor — Персонализированное питание из потребительских генетических данных
Популяционная генетика и GWAS¶
bioSkills: population-genetics/ — association-testing (PLINK GWAS), plink-basics, population-structure, linkage-disequilibrium, scikit-allel-analysis, selection-statistics causal-genomics/ — mendelian-randomization, fine-mapping, colocalization-analysis, mediation-analysis, pleiotropy-detection phasing-imputation/ — haplotype-phasing, genotype-imputation, imputation-qc, reference-panels ClawBio: claw-ancestry-pca — PCA происхождения по референсной панели SGDP
Метагеномика и микробиом¶
bioSkills: metagenomics/ — kraken-classification, metaphlan-profiling, abundance-estimation, functional-profiling, amr-detection, strain-tracking, metagenome-visualization microbiome/ — amplicon-processing, diversity-analysis, differential-abundance, taxonomy-assignment, functional-prediction, qiime2-workflow ClawBio: claw-metagenomics — Профилирование дробовой метагеномики (таксономия, резистом, функциональные пути)
Сборка и аннотация геномов¶
bioSkills: genome-assembly/ — hifi-assembly, long-read-assembly, short-read-assembly, metagenome-assembly, assembly-polishing, assembly-qc, scaffolding, contamination-detection genome-annotation/ — eukaryotic-gene-prediction, prokaryotic-annotation, functional-annotation, ncrna-annotation, repeat-annotation, annotation-transfer long-read-sequencing/ — basecalling, long-read-alignment, long-read-qc, clair3-variants, structural-variants, medaka-polishing, nanopore-methylation, isoseq-analysis
Структурная биология и хемоинформатика¶
bioSkills: structural-biology/ — alphafold-predictions, modern-structure-prediction, structure-io, structure-navigation, structure-modification, geometric-analysis chemoinformatics/ — molecular-io, molecular-descriptors, similarity-searching, substructure-search, virtual-screening, admet-prediction, reaction-enumeration ClawBio: struct-predictor — Локальное предсказание структур AlphaFold/Boltz/Chai с возможностью сравнения
Протеомика¶
bioSkills: proteomics/ — data-import, peptide-identification, protein-inference, quantification, differential-abundance, dia-analysis, ptm-analysis, proteomics-qc, spectral-libraries ClawBio: proteomics-de — Дифференциальная экспрессия протеомов
Анализ путей и генные сети¶
bioSkills: pathway-analysis/ — go-enrichment, gsea, kegg-pathways, reactome-pathways, wikipathways, enrichment-visualization gene-regulatory-networks/ — scenic-regulons, coexpression-networks, differential-networks, multiomics-grn, perturbation-simulation
Иммуноинформатика¶
bioSkills: immunoinformatics/ — mhc-binding-prediction, epitope-prediction, neoantigen-prediction, immunogenicity-scoring, tcr-epitope-binding tcr-bcr-analysis/ — mixcr-analysis, scirpy-analysis, immcantation-analysis, repertoire-visualization, vdjtools-analysis
CRISPR и геномная инженерия¶
bioSkills: crispr-screens/ — mageck-analysis, jacks-analysis, hit-calling, screen-qc, library-design, crispresso-editing, base-editing-analysis, batch-correction genome-engineering/ — grna-design, off-target-prediction, hdr-template-design, base-editing-design, prime-editing-design
Управление рабочими процессами¶
bioSkills: workflow-management/ — snakemake-workflows, nextflow-pipelines, cwl-workflows, wdl-workflows ClawBio: repro-enforcer — Экспорт любого анализа как пакета воспроизводимости (Conda env + Singularity + контрольные суммы) galaxy-bridge — Доступ к 8000+ инструментам Galaxy через usegalaxy.org
Специализированные домены¶
bioSkills: alternative-splicing/ — splicing-quantification, differential-splicing, isoform-switching, sashimi-plots, single-cell-splicing, splicing-qc ecological-genomics/ — edna-metabarcoding, landscape-genomics, conservation-genetics, biodiversity-metrics, community-ecology, species-delimitation epidemiological-genomics/ — pathogen-typing, variant-surveillance, phylodynamics, transmission-inference, amr-surveillance liquid-biopsy/ — cfdna-preprocessing, ctdna-mutation-detection, fragment-analysis, tumor-fraction-estimation, methylation-based-detection, longitudinal-monitoring epitranscriptomics/ — m6a-peak-calling, m6a-differential, m6anet-analysis, merip-preprocessing, modification-visualization metabolomics/ — xcms-preprocessing, metabolite-annotation, normalization-qc, statistical-analysis, pathway-mapping, lipidomics, targeted-analysis, msdial-preprocessing flow-cytometry/ — fcs-handling, gating-analysis, compensation-transformation, clustering-phenotyping, differential-analysis, cytometry-qc, doublet-detection, bead-normalization systems-biology/ — flux-balance-analysis, metabolic-reconstruction, gene-essentiality, context-specific-models, model-curation rna-structure/ — secondary-structure-prediction, ncrna-search, structure-probing
Визуализация данных и отчётность¶
bioSkills: data-visualization/ — ggplot2-fundamentals, heatmaps-clustering, volcano-customization, circos-plots, genome-browser-tracks, interactive-visualization, multipanel-figures, network-visualization, upset-plots, color-palettes, specialized-omics-plots, genome-tracks reporting/ — rmarkdown-reports, quarto-reports, jupyter-reports, automated-qc-reports, figure-export ClawBio: profile-report — Отчётность по профилю анализа data-extractor — Извлечение числовых данных из изображений научных графиков (через vision) lit-synthesizer — Поиск в PubMed/bioRxiv, обобщение, графы цитирований pubmed-summariser — Поиск генов/заболеваний в PubMed со структурированным обзором
Доступ к базам данных¶
bioSkills: database-access/ — entrez-search, entrez-fetch, entrez-link, blast-searches, local-blast, sra-data, geo-data, uniprot-access, batch-downloads, interaction-databases, sequence-similarity ClawBio: ukb-navigator — Семантический поиск по 12 000+ полям UK Biobank clinical-trial-finder — Поиск клинических исследований
Планирование экспериментов¶
bioSkills: experimental-design/ — power-analysis, sample-size, batch-design, multiple-testing
Машинное обучение для омиксных данных¶
bioSkills: machine-learning/ — omics-classifiers, biomarker-discovery, survival-analysis, model-validation, prediction-explanation, atlas-mapping ClawBio: claw-semantic-sim — Индекс семантического сходства для литературы по заболеваниям (PubMedBERT) omics-target-evidence-mapper — Агрегация свидетельств на уровне мишеней из омиксных источников
Настройка окружения¶
Эти навыки предполагают наличие биоинформатической рабочей станции. Типичные зависимости:
[code]
# Python
pip install biopython pysam cyvcf2 pybedtools pyBigWig scikit-allel anndata scanpy mygene
# R/Bioconductor
Rscript -e 'BiocManager::install(c("DESeq2","edgeR","Seurat","clusterProfiler","methylKit"))'
# CLI инструменты (Ubuntu/Debian)
sudo apt install samtools bcftools ncbi-blast+ minimap2 bedtools
# CLI инструменты (macOS)
brew install samtools bcftools blast minimap2 bedtools
# Или через Conda (рекомендуется для воспроизводимости)
conda install -c bioconda samtools bcftools blast minimap2 bedtools fastp kraken2
[/code]
Возможные проблемы¶
- Загруженные навыки НЕ в формате SKILL.md Hermes. Они используют собственную структуру (bioSkills: сборники шаблонов кода; ClawBio: README + Python-скрипты). Читайте их как экспертные справочные материалы.
- bioSkills — это справочные руководства: они показывают правильные параметры и шаблоны кода, но не являются исполняемыми пайплайнами.
- Навыки ClawBio являются исполняемыми — у многих есть флаги
--demo, и их можно запускать напрямую. - Оба репозитория предполагают, что биоинформатические инструменты уже установлены. Перед запуском пайплайнов проверяйте prerequisites.
- Для ClawBio сначала выполните
pip install -r requirements.txtв клонированном репозитории. -
Файлы геномных данных могут быть очень большими. Следите за дисковым пространством при загрузке референсных геномов, наборов данных SRA или построении индексов.
- Справочно: полный SKILL.md
- Источники
- Как загрузить и использовать навык
- Указатель навыков по доменам
- Основы работы с последовательностями
- Контроль качества чтений и выравнивание
- Поиск вариантов и аннотация
- Дифференциальная экспрессия (Bulk RNA-seq)
- Одноклеточный RNA-seq
- Пространственная транскриптомика
- Эпигеномика
- Фармакогеномика и клинические данные
- Популяционная генетика и GWAS
- Метагеномика и микробиом
- Сборка и аннотация геномов
- Структурная биология и хемоинформатика
- Протеомика
- Анализ путей и генные сети
- Иммуноинформатика
- CRISPR и геномная инженерия
- Управление рабочими процессами
- Специализированные домены
- Визуализация данных и отчётность
- Доступ к базам данных
- Планирование экспериментов
- Машинное обучение для омиксных данных
- Настройка окружения
- Возможные проблемы