در پژوهشگاه علوم و فناوری اطلاعات انجام شد؛

راه اندازی سامانه پیكره های ایرانداك برای آسان سازی فرایند پژوهش

راه اندازی سامانه پیكره های ایرانداك برای آسان سازی فرایند پژوهش

سامانه پیکره های ایرانداک (ساپا) در پاسخ به نیاز پژوهشگران کشور در آسان سازی فرایند پژوهش شروع به کار کرد.


به گزارش هوا فضا به نقل از پژوهشگاه علوم و فناوری اطلاعات ایران، سامانه پیکره های ایرانداک (ساپا) در پاسخ به نیاز پژوهشگران کشور در آسان سازی فرایند پژوهش، در نشانی SAPA.IRANDOC.AC.IR راه اندازی و در دسترس تمامی پژوهشگران کشور گذاشته شد. خیلی از پژوهش های زبان شناسی و تصمیم گیری ها در برنامه ریزی زبانی، تنها با کاربرد یک پیکره زبانی شدنی هستند. پیکره، مجموعه ای نظام مند، کامپیوتری و درست از زبان است که جهت بررسی های زبان شناختی به کار می رود. پیکره ها کاربردهای بسیاری در پردازش زبان طبیعی و درک و بازشناسی گفتار، تبدیل متن به گفتار و گفتار به متن، نگارش فرهنگ ها، آموزش و پژوهش، ساخت پایگاه های داده زبانی، بررسی واژه های هم آیند در زبان های گوناگون، پایشگری زبان برای پیگیری و ردگیری دگرگونی های زبانی، ترجمه ماشینی، توسعه مفاهیم و منابع در پیوند با واژگان، نگارش و گسترش مهارت های نوشتاری، آموزش و یادگیری زبان با شناخت گویش ها و گوناگونی زبان ها، معناشناسی، تحلیل کلام، زبان شناسی اجتماعی، زبان شناسی حقوقی، واکاوی ژانرهای ادبی و پژوهش های دستور زبان دارند. سامانه پیکره های ایرانداک (ساپا) که می تواند از چندین پیکره پشتیبانی کند، حالا دارای یک پیکره با نام «پیکره پژوهش نامه» با نزدیک به چهار میلیون و ۷۸۰ هزار واژه تخصصی و میان رشته در زمینه هایی مانند علم اطلاعات و دانش شناسی، فناوری اطلاعات، مدیریت دانش، زبان شناسی رایانشی، اصطلاح شناسی و مانند آنها است. این پیکره از مقاله های «پژوهش نامه پردازش و مدیریت اطلاعات» ساخته شده است و برای پژوهش هایی که نیازمند بهره گیری از پیکره های تخصصی هستند، ارزش و کاربرد بسیاری دارد. هنگام بازیابی اطلاعات در پیکره پژوهش نامه، افزون بر نمایش واژه یا عبارتِ جستجو در بافت زبان، نام مقاله ای که آن واژه یا عبارت در آن به کار رفته است، مبحث مقاله، پدیدآوران مقاله و فراوانی واژه یا عبارت جستجو هم نمایش داده می شوند. داده های این پیکره دارای برچسب اجزای واژگانی کلام (POS tag) هم هستند که در خیلی از پردازش های زبان به کار می روند و مقوله واژه ها (مانند اسم، صفت، قید، و …) را پیدا می کنند.


منبع:

1400/04/12
17:08:40
0.0 / 5
256
این مطلب را می پسندید؟
(0)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۴ بعلاوه ۳