دوره 2، شماره 10، اردیبهشت 99، صفحات 16 - 28
نویسندگان : سحر اسماعیلی شایان *

چکیده :
خلاصه سازی متون یکی از روش های استخراج اطلاعات مفید و مهم از حجم عظیم داده های متنی است که در اهدافی چون تحلیل داده های متنی به کار بسته می شود. طی سالیان متمادی، تکنیک های خلاصه سازی متن بسیاری توسعه داده شده اند که برخی تنها به انتخاب جملات کوتاه و آوردن آن ها در خلاصه بسنده کرده و برخی دیگر بدون توجه به همبستگی معنایی جملات، آن ها را گزینش و در خلاصه می آورند. تحلیل معنایی متون نیازمند روش های استخراج خلاصه با رویکرد معنایی است. در این پژوهش، سامانه ی خلاصه ساز زبان فارسی با استفاده از توسعه و به کارگیری الگوریتم TextRank گوگل و با بهره گیری از مدل سازی سند متنی به صورت گرافی که در آن جملات به صورت گره و ارتباط جملات به صورت یال های گراف و میزان ارتباط معنایی میان جملات به صورت وزن هر یال مدل گردیده، توسعه داده شده است. نتایج پژوهش با بررسی 1146 مقاله فارسی خلاصه شده توسط این سامانه، نشان داد که سامانه توسعه داده شده با اختصاص رتبه ی بالاتر به جملات حامل معنای بیشتر و تهیه خلاصه نهایی از آن ها، عملکرد خوبی در استخراج خلاصه معنایی از متون الکترونیکی فارسی دارد.

کلمات کلیدی :
متن کاوی، خلاصه سازی خودکار، اسناد الکترونیک فارسی، گراف وزن دار