چکیده
افزایش دقت و جامع بودن تکنیکهای مدرن هوش مصنوعی در پشتیبانی از تجزیه و تحلیل دادههای پیچیده، مانند تصاویر پزشکی، به طور تصاعدی جمعآوری دادههای دنیای واقعی را برای اهداف تحقیقاتی افزایش داده است. این واقعیت منجر به توسعه مخازن بین المللی و راه حل های محاسباتی با کارایی بالا برای مقابله با تقاضای محاسباتی برای مدل های آموزشی شده است. با این حال، سایر مراحل در توسعه نشانگرهای زیستی تصویربرداری پزشکی به چنین منابع محاسباتی فشرده ای نیاز ندارند، که منجر به راحتی یکپارچه سازی باطن های مختلف محاسباتی متناسب با نیازهای پردازش مراحل مختلف گردش کار پردازش شده است. ما در این مقاله یک معماری مخزن توزیع شده و فدرال را برای توسعه و استفاده از نشانگرهای زیستی تصویر پزشکی ارائه میکنیم که چندین ذخیرهسازی ابری را با پشتوانههای پردازش ابری و HPC ترکیب میکند. این معماری برای خدمت به پروژه PRIMAGE (H2020 826494) با هدف جمعآوری و مدیریت دادههای سرطان اطفال به کار گرفته شده است. این مخزن به طور یکپارچه پشتیبان های ذخیره سازی توزیع شده، یک خوشه Kubernetes الاستیک در یک ابر داخلی و یک ابر رایانه را یکپارچه می کند. کارهای پردازش از طریق یک پلت فرم کنترل واحد انجام می شود که داده ها را در صورت تقاضا همگام می کند. این مقاله مشخصات انواع مختلف برنامهها و اعتبارسنجی را از طریق یک مورد استفاده نشان میدهد که از بیشتر ویژگیهای پلتفرم استفاده میکند.