Informace o projektu
Portálové řešení pro správu a zpracování life-science datových sad a jejich metadat ukládaných v systému Onedata
- Kód projektu
- 744R1/2023
- Období řešení
- 7/2023 - 6/2024
- Investor / Programový rámec / typ projektu
-
CESNET
- Fond rozvoje CESNETu
- Fakulta / Pracoviště MU
- Přírodovědecká fakulta
Moderní výzkum produkuje velké množství dat, které je potřeba ukládat. Pro tento účel už některé laboratoře NCBR a CEITEC využívají řešení postavené nad distribuovaným úložištěm Onedata běžícím nad infrastrukturou e-INFRA CZ. To bylo původně nasazeno pro laboratoř CEMCOF na CEITEC, a později rozšířeno i pro jiné zdroje dat. Aby bylo toto řešení rutinně používáno uživateli bez větších IT znalostí a zároveň abychom data ukládali v souladu s FAIR principy, je potřeba jej rozšířit o uživatelsky přívětivou správu datových sad a jejich metadat. Cílem projektu je tak vytvoření modulárního portálového řešení, které umožní spravovat datové sady, spouštět nad nimi definované aplikace a doplnit je o metadatový popis.
Metadatový popis je pro každou laboratoř jedinečný a skládá se z informací, které lze automaticky vyčíst z vlastních dat, a anotací, které musí uživatel zadat ručně. Každý modul by proto obsahoval definici konkrétního metadatového schématu spolu s naprogramovanými nástroji pro automatizovanou extrakci metadat a přívětivé grafické rozhraní pro jejich ruční doplnění a editaci. Dále by umožňoval export metadat do zavedených obecných i doménově specifických metadatových katalogů.
Mnohé datové sady potřebují jejich uživatelé dále zpracovávat pomocí specializovaného software nebo nad nimi provádět opakované zkoumání. Za účelem zpracování těchto dat vytvoříme nástroj, který uživatelům usnadní spuštění doménově specifického software nad existujícími daty uloženými v systému Onedata skrze uživatelsky přívětivé webové rozhraní. Jako první prototypovou aplikaci zpřístupníme takto software Scipion.
Navrhované řešení budeme nejprve nasazovat v jednotlivých laboratořích v rámci MU, ale bude použitelné i dalšími pracovišti. Vhodnou platformou pro diseminaci tohoto řešení na další instituce jsou infrastrukturní projekty: ELIXIR CZ, jehož jsme součástí, Czech-BioImaging, nebo CIISB. Zároveň počítáme s tím, že navržené řešení usnadní přístup k úložištím e-infrastruktury CESNET, a zvýší tak zájem o jejich použití.
Publikace
Počet publikací: 5
2024
-
Hands-on experience with big data transfer via iRODS and Onedata
Rok: 2024, druh: Další prezentace na konferencích
-
Research Data Management at CEITEC MU
Rok: 2024, druh: Další prezentace na konferencích
2023
-
Enhancing Data Accessibility: Strategies and Tools for Effective Metadata Management
Rok: 2023, druh: Další prezentace na konferencích
-
Management of life-science data and their metadata
Rok: 2023, druh: Další prezentace na konferencích
-
Onedata4Sci: Life-science experimental datasets management system
Rok: 2023, druh: Konferenční abstrakty