۹ آبان ۱۳۸۸

فعاليتهاي داده كاوي

فرايند داده كاوي از نظر كلي به دو دسته تقسيم ميشه. توصيفي و پيش گويي كننده.
حالت توصيفي شامل تكنيكهاي خوشه بندي ، كشف قوانين وابستگي ، كشف دنباله ، خلاصه سازي ، قوانين تجمعي، تشريح و مصور سازِيه.
حالت پيش گويي هم شامل تكنيكهاي دسته بندي، رگرسيون، سريهاي زماني، تخمين و پيش بينيه

بعبارت ديگه داده كاوي در دو نوع هدايت شده و هدايت نشده ظاهر ميشه. داده كاوي هدايت شده، داراي هدفي خاص و از پيش تعيين شده ست كه بدنبال الگويي خاص ميگرده. در حاليكه هدف داده كاوي غير هدايت شده يافتن الگوها يا تشابهات بين گروههايي از اطلاعات، بدون داشتن هدفي خاص و يا مجموعه اي از دسته ها و الگوهاي از پيش تعيين شده ست.

۵ آبان ۱۳۸۸

رابطه داده كاوي با ديگر تكنيكها

از ديدگاه آماري ، داده كاوي بعنوان ابزار كامپيوتري خودكار براي تحليل مجموعه داده هاي بزرگ و پيچيدست. داده كاوي بعنوان يك دانش ميان رشته اي ، تكنيكهاي مختلفي را از آمار، يادگيري ماشيني، تشخيص الگو، پايگاه داده ها و مصور سازي گرد هم مياره تا مشكل استخراج اطلاعات از پايگاه داده هاي بزرگ رفع بشه.

۲۰ مهر ۱۳۸۸

داده کاوی و کشف دانش معادل هم نیستند

برای اولین بار، واژه كشف دانش در پايگاه داده ها ، در سال 1989 استفاده شده و به كل فرايند كشف دانش مفيد از داده ها اطلاق ميشه. اگر چه در اغلب موارد كشف دانش و داده كاوي دو واژه معادل تلقي ميشوند ولي در واقع كشف دانش و داده كاوي معادل هم نيستند ، بلكه داده كاوي يك قدم اصلي از فرايند كشف دانشه. كشف دانش در پايگاه داده ها عبارتست از تشخيص الگوها و مدلهاي معتبر ، جديد، بالقوه مفيد و قابل درك از داده ها.
در واقع هدف از داده كاوي و كشف دانش ، يافتن الگوهاي جذاب و يا مدلهايي است كه بصورت پنهان در پايگاه داده ها وجود دارند.




۱۳ مهر ۱۳۸۸

سلامی پس از مدتها دوری

با عرض پوزش از دوستان بخاطر غیبت طولانی مدتم
امیدوارم در آینده فرصت کافی و مناسب برای جبران قصورم در بروز کردن مطالب وبلاگ پیش بیاد.
و اما ادامه مطلب:
دانش نوين داده كاوي (Data Mining) يكي از ده دانش در حال توسعه ايه كه دهه آينده را با انقلاب تكنولوژيك مواجه خواهد کرد و بهمین دلیل در سالهاي اخير در دنيا گسترش فوق العاده سريعي داشته. در طول دهه گذشته، حجم زيادي از داده ها در پايگاه داده ها انباشته و ذخيره شده اند و نتيجه اين انباشتگي اينه كه سازمانها در داده غني ولي در كسب دانش بسيار ضعيفند. امروز ميزان داده هاي در دسترس، هر پنج سال دو برابر ميشود و سازماني تواناست كه قادر باشه حداقل 7 درصد ازاطلاعاتش را مديريت کنه.
اما فن آوري داده كاوي، بعنوان ابزاري نوين، اپراتورها را قادر ميکنه تا از سرمايه داده هاشون به بهترين شكلي بهره برداري کنن. داده كاوي فرايندِيه كه از انواع تكنيكهاي مدلسازي و آناليز داده،كه از آمار و علوم كامپيوتر وام گرفته شده ان، براي كشف الگوها و ارتباطات در داده ها و كشف دانش پنهان درون داده ها بهره ميگیره كه نهايتا اين دانش پنهان، براي پشتيباني از يك فرايند تصميم گيري منطقي و عاقلانه مورد استفاده قرار ميگيرد.کاربردهاي داده کاوي بسيار متنوع و فراگيره. در واقع ميشه ادعا کرد که در هر کجا که انبوهي از داده ها ذخيره شده وجود داشته باشه، ميشه از داده کاوي بعنوان ابزاري براي حل مسئله کمک گرفت. فهرست زير مقايسه اي آماري را از کاربرد داده کاوي در حل مسائل گوناگون که در ماه دسامبر سال 2008 منتشر شده ارائه ميدهد.

Industries / Fields where you applied Data Mining in 2008: [107 voters]
CRM/ consumer analytics (41)
38.30%
Health care/ HR (10)
9.30%
Banking (34)
31.80%
Manufacturing (9)
8.40%
Fraud Detection (21)
19.60%
e-Commerce (8)
7.50%
Finance (18)
16.80%

Web usage mining (8)
7.50%
Direct Marketing/ Fundraising (15)
14.00%
Social Policy/Survey analysis (8)
7.50%
Other (14)
13.10%
Medical/ Pharma (8)
7.50%
Investment / Stocks (14)
13.10%
Security / Anti-terrorism (6)
5.60%
Credit Scoring (14)
13.10%
Search / Web content mining (6)
5.60%
Telecom / Cable (13)
12.10%
Government/Military (4)
3.70%
Retail (13)
12.10%
Travel / Hospitality (3)
2.80%
Advertising (13)
12.10%
Junk email / Anti-spam (3)
2.80%
Biotech/Genomics (12)
11.20%
Entertainment/ Music (3)
2.80%
Science (11)
10.30%
Social Networks (2)
1.90%
Insurance (11)
10.30%
None (2)
1.90%