fix prepare pfam

91d244d1 · Rudel Fankep · 2b012eee · 91d244d1 · 91d244d1 · 91d244d1
Commit 91d244d1 authored 5 years ago by Rudel Fankep
--- a/dbman.egg-info/SOURCES.txt
+++ b/dbman.egg-info/SOURCES.txt
 README.rst
-blast_db.sh
-delete_remote_file.sh
-download_db.sh
-download_json.sh
-ghostx_db.sh
-hmmer_pfam.sh
-prepare_card.sh
-prepare_pfam.sh
-prepare_swissprot.sh
+requirements.txt
 setup.cfg
 setup.py
 test.py
 testfile.txt
-upload_db.sh
-upload_json.sh
 dbman/__init__.py
 dbman/main.py
 dbman.egg-info/PKG-INFO
@@ -24,6 +14,17 @@ dbman.egg-info/not-zip-safe
 dbman.egg-info/pbr.json
 dbman.egg-info/requires.txt
 dbman.egg-info/top_level.txt
+dbman/scripts/blast_db.sh
+dbman/scripts/delete_remote_file.sh
+dbman/scripts/download_db.sh
+dbman/scripts/download_json.sh
+dbman/scripts/ghostx_db.sh
+dbman/scripts/hmmer_pfam.sh
+dbman/scripts/prepare_card.sh
+dbman/scripts/prepare_pfam.sh
+dbman/scripts/prepare_swissprot.sh
+dbman/scripts/upload_db.sh
+dbman/scripts/upload_json.sh
 local_databases/dbman_metadata.json
 local_databases/swissprot_2019_06_blast/uniprot_sprot.fasta.phr
 local_databases/swissprot_2019_06_blast/uniprot_sprot.fasta.pin

--- a/dbman.egg-info/pbr.json
+++ b/dbman.egg-info/pbr.json
-{"git_version": "cfea2f1", "is_release": false}
\ No newline at end of file
+{"git_version": "2b012ee", "is_release": false}
\ No newline at end of file
--- a/dbman/main.py
+++ b/dbman/main.py
@@ -405,7 +405,7 @@ data = {'swissprot': {'prepare': pkg_resources.resource_filename(__name__, "scri
                    'filename': 'uniprot_sprot.fasta',
                    'version': get_swissprot_version
                    },
-            'pfam': {'prepare': './prepare_pfam.sh',
+            'pfam': {'prepare': pkg_resources.resource_filename(__name__, "scripts/prepare_pfam.sh"),
                    'tool': {'hmmer': pkg_resources.resource_filename(__name__, "scripts/hmmer_pfam.sh")},
                    'filename': 'Pfam-A.hmm',
                    'version': get_pfam_version

--- a/testfile.txt
+++ b/testfile.txt
-Dbxref Quellcode, evtl. als Vorlage nutzbar: https://git.computational.bio.uni-giessen.de/SOaAS/dbxref/tree/master/dbxref
-
-Beschreibung:
-
-Das Protein Sequence Observation Tool integriert diverse bioinformatische Tools zur Anreicherung von Informationen zu Proteinen und normalisiert diese in das JSON Format, sodass die Informationen einfach von weiteren Programmen weiterverarbeitet werden können. In dieser Arbeit soll der ein Hilfsprogramm geschrieben werden, dass von PSOT benötigte Datenbanken vorbereitet und zur Verfügung stellt. Für einzelne Datenbanken gibt es bereits Skripte zur Installation und Aufbereitung. Diese Skripte sollen in einer Anwendung systematisch zusammen geführt und über eine einfach zu nutzende Kommandozeilenschnittstelle nutzbar gemacht werden. Vorraussetzung sind der Umgang mit der Linux Kommandozeile und solide Kenntnisse in Python 3.
-
-Stories:
-
-Verschiedene Rollen:
-    PSOT Entwickler
-    PSOT Nutzer
-   
-    . Der PSOT Entwickler benötigt eine neue Datenbank für sein verteiltes Programm. Er schreibt einmalig ein Script das die Datenbank bezieht (herunterlädt) und eins um die Datenbank für seine Anwendung vorzubereiten. Diese Skripte werden im db Tool hinterlegt und stehen damit allen unter einem definierten Namen (z.B. der Datenbankname und für welches Programm es aufbereitet wurde) zur Verfügung.
-    . Der PSOT Entwickler hat seine Datenbank vorbereitet und möchte sie jetzt in seiner verteilten Anwendung allen Knoten zur Verfügung stellen. Dazu konfiguriert er das db Tool mit seinem S3 Cloud Speicher und beauftragt es damit die grade erstellte Datenbank dorthin hochzuladen. Die Daten werden komprimiert im Cloud Speicher abgelegt. Auf den Knoten beauftragt er das db Tool die Daten herunterzuladen und an die gewünschte Stelle zu entpacken.
-    . Der PSOT Nutzer möchte wissen welche Datenbanken in dem öffentlichen Repository liegen. Dazu ruft er das db tool auf und es listet alle verfügbaren Datenbanken auf.
-    . Das db Tool prüft ob eine bestimmte Datenbank verfügbar ist, damit es diese nicht erneut herunterladen muss.
-    . Der Nutzer möchte wissen an welcher Stelle im System eine Datenbank für ein bestimmtes Tool abgelegt ist. Er ruft das db tool mit der Datenbank und dem Tool auf und erhält den Pfad zurück.
-   
-Beispielaufrufe:
-    dbman prepare "UniprotKB/swiss-prot" "ghostx"
-    dbman upload "UniprotKB/swiss-prot" "ghostx"
-    dbman download "UniprotKB/swiss-prot" "ghostx"
-    dbman location "UniprotKB/swiss-prot" "ghostx"
-    dbman list database recipes
-    dbman list local databases
-    dbman list remote databases
-
-Beispieldatenbanken:
-    swissprot
-    trembl
-    eggnog
-    pfam
-    card
-
-
-Evtl. kann auch biomaj für das Problem genutzt werden: https://biomaj.genouest.org/
-
-Beispielaufrufe: 
-
-	# Vorher: In dem Datenbankverzeichnis liegt keine swiss-prot Datenbank fuer ghostx
-	dbman prepare "UniprotKB/swiss-prot" "ghostx"
-	-> Ergebnis: In dem Datenbankvorbereitungsverzeichnis liegt die ghostx Datenbank. die datenbank kann benutzt werden
-	
-	# Vorher  In dem Datenbankverzeichnis liegt die swiss-prot Datenbank fuer ghostx
-	dbman upload "UniprotKB/swiss-prot" "ghostx"
-	-> Ergebnis: Im S3 liegt die komprimierte swiss-prot Datenbank für ghostx
-	
-	# Vorher: Im S3 liegt die komprimierte swiss-prot Datenbank für ghostx
-	dbman download "UniprotKB/swiss-prot" "ghostx"
-	-> Ergebnis: In dem Datenbankvorbereitungsverzeichnis liegt die ghostx Datenbank. datenbank nutzbar
-	
-	# Vorher:  In dem Datenbankvorbereitungsverzeichnis liegt die ghostx Datenbank
-	dbman location "UniprotKB/swiss-prot" "ghostx"
-	-> Ergebnis: Pfad der swiss-prot Datenbank fuer ghostx
-	
-	# Vorher: Egal
-	dbman list database recipes
-	-> Ergebnis: 
-		swiss-prot[ghostx]
-		swiss-prot[blastp]
-		pfam[hmmer]
-	
-	# Vorher: Datenbank sind lokal vorhanden
-	dbman list local databases
-	->Ergebnis:
-		swiss-prot[ghostx] version: x.y.z erstellt am: <datum>
-		swiss-prot[blastp] version: x.y.z erstellt am: <datum>
-	
-	dbman list remote databases
-	->Ergebnis:
-		swiss-prot[ghostx] version: x.y.z erstellt am: <datum>
-		swiss-prot[blastp] version: x.y.z erstellt am: <datum>
-                pfam[hmmer] version: x.y.z erstellt am: <datum>


 Database repository---> https://github.com/MGX-metagenomics/databases/blob/master/card.build 
@@ -78,20 +5,11 @@ Database repository---> https://github.com/MGX-metagenomics/databases/blob/maste
 anzeigen lassen---> echo $VARIABLE
 löschen---> unset VARIABLE
 setzen---> export VARIABLE = pfad
-
-https://setuptools.readthedocs.io/en/latest/pkg_resources.html#basic-resource-access
-
-->ResourceManager API¶
-
-https://docs.python.org/3.7/library/tempfile.html
-
-le programm est-il utilisable sur windows?
-commen se fait la remiz? sur CD ?
-
-
-
 1-setup.py
 2-dbman verzeichnis
 3- __init__.py in dbman 

-pip install git+https://git.computational.bio.uni-giessen.de/cfankep/psotdb.git
\ No newline at end of file
+pip install git+https://git.computational.bio.uni-giessen.de/cfankep/psotdb.git
+
+
+list_remote_databases
\ No newline at end of file