چکیده
افزایش دقت و جامع بودن تکنیکهای مدرن هوش مصنوعی در پشتیبانی از تجزیه و تحلیل دادههای پیچیده، مانند تصاویر پزشکی، به طور تصاعدی جمعآوری دادههای دنیای واقعی را برای اهداف تحقیقاتی افزایش داده است. این واقعیت منجر به توسعه مخازن بین المللی و راه حل های محاسباتی با کارایی بالا برای مقابله با تقاضای محاسباتی برای مدل های آموزشی شده است. با این حال، سایر مراحل در توسعه نشانگرهای زیستی تصویربرداری پزشکی به چنین منابع محاسباتی فشرده ای نیاز ندارند، که منجر به راحتی یکپارچه سازی باطن های مختلف محاسباتی متناسب با نیازهای پردازش مراحل مختلف گردش کار پردازش شده است. ما در این مقاله یک معماری مخزن توزیع شده و فدرال را برای توسعه و استفاده از نشانگرهای زیستی تصویر پزشکی ارائه میکنیم که چندین ذخیرهسازی ابری را با پشتوانههای پردازش ابری و HPC ترکیب میکند. این معماری برای خدمت به پروژه PRIMAGE (H2020 826494) با هدف جمعآوری و مدیریت دادههای سرطان اطفال به کار گرفته شده است. این مخزن به طور یکپارچه پشتیبان های ذخیره سازی توزیع شده، یک خوشه Kubernetes الاستیک در یک ابر داخلی و یک ابر رایانه را یکپارچه می کند. کارهای پردازش از طریق یک پلت فرم کنترل واحد انجام می شود که داده ها را در صورت تقاضا همگام می کند. این مقاله مشخصات انواع مختلف برنامهها و اعتبارسنجی را از طریق یک مورد استفاده نشان میدهد که از بیشتر ویژگیهای پلتفرم استفاده میکند.
Abstract
The increased accuracy and exhaustivity of modern Artificial Intelligence techniques in supporting the analysis of complex data, such as medical images, have exponentially increased real-world data collection for research purposes. This fact has led to the development of international repositories and high-performance computing solutions to deal with the computational demand for training models. However, other stages in the development of medical imaging biomarkers do not require such intensive computing resources, which has led to the convenience of integrating different computing backends tailored for the processing demands of the various stages of processing workflows. We present in this article a distributed and federated repository architecture for the development and application of medical image biomarkers that combines multiple cloud storages with cloud and HPC processing backends. The architecture has been deployed to serve the PRIMAGE (H2020 826494) project, aiming to collect and manage data from paediatric cancer. The repository seamlessly integrates distributed storage backends, an elastic Kubernetes cluster on a cloud on-premises and a supercomputer. Processing jobs are handled through a single control platform, synchronising data on demand. The article shows the specification of the different types of applications and a validation through a use case that make use of most of the features of the platform.
تعداد صفحات ترجمه:40