دانلود مقاله الگوریتم (پایگاه داده ها)

Word 154 KB 17410 25
مشخص نشده مشخص نشده کامپیوتر - IT

قیمت قدیم:۱۶,۰۰۰ تومان

قیمت: ۱۰,۰۰۰ تومان

دانلود فایل

بخشی از محتوا
وضعیت فهرست و منابع

در این گزارش ما به بررسی ویژگی های الگوریتمهای کنترل همروندی توزیعی که بر پایه مکانیزم قفل دو مرحله ای(2 Phase Locking) ایجاد شده اند خواهیم پرداخت.

محور اصلی این بررسی بر مبنای تجزیه مساله کنترل همروندی به دو حالت read-wirte و write-write می‌باشد.

در این مقال، تعدادی از تکنیکهای همزمان سازی برای حل هر یک از قسمتهای مساله بیان شده و سپس این تکنیکها برای حل کلی مساله با یکدیگر ترکیب می‌شوند.

در این گزارش بر روی درستی و ساختار الگوریتمها متمرکز خواهیم شد.

در این راستا برای ساختار پایگاه داده توزیعی یک سطحی از انتزاع را در نظر می‌گیریم تا مساله تا حد ممکن ساده سازی شود.

1.

مقدمه : کنترل همروندی فرآیندی است که طی آن بین دسترسی های همزمان به یک پایگاه داده در یک سیستم مدیریت پایگاه داده چند کاربره هماهنگی بوجود می‌آید.

کنترل همروندی به کاربران اجازه می‌دهد تا در یک حالت چند برنامگی با سیستم تعامل داشته باشند در حالیکه رفتار سیستم از دیدگاه کاربر به نحو خواهد بود که کاربر تصور می‌کند در یک محیط تک برنامه در حال فعالیت است.

سخت ترین حالت در این سیستم مقابله با بروز آوری های آزار دهنده ای است که یک کاربر هنگام استخراج داده توسط کاربر دیگر انجام می‌دهد.

به دو دلیل ذیل کنترل همروندی در پایگاه داده های توزیعی از اهمیت بالایی برخوردار است:
1.

کاربراان ممکن است به داده هایی که در کامپیوترهای مختلف در سیستم قرار دارند دسترسی پیدا کنند.
2.

یک مکانیزم کنترل همروندی در یک کامپیوتر از وضعیت دسترسی در سایر کامپیوترها اطلاعی ندارد.
مساله کنترل همروندی در چندین سال قبل کاملا مورد بررسی قرار گفته است و در خصوص پایگاه‌داده‌های متمرکز کاملا شناخته شده است.

در خصوص این مسال در پایگاه داده توزیعی با توجه به اینکه مساله در حوزه مساله توزیعی قرار می‌گیرد بصورت مداوم راهکارهای بهبود مختلف عرضه می‌شود.

یک تئوری ریاضی وسیع برای تحلیل این مساله ارائه شده و یک راهکار قفل دو مرحله ای به عنوان راه حل استاندارد در این خصوص ارائه شده است.

بیش از 20 الگوریتم کنترل همروندی توزیعی ارائه شده است که بسیاری از آنها پیاده سازی شده و در حال استفاده می‌باشند.این الگوریتمها معمولا پیچیده هستند و اثبات درستی آنها بسیار سخت می‌باشد.

یکی از دلایل اینکه این پیچیدگی وجود دارد این است که آنها در اصطلاحات مختلف بیان می‌شوند و بیان های مختلفی برای آنها وجود دارد.

یکی از دلایل اینکه این پیچدگی وجود دارد این است که مساله از زیر قسمتهای مختلف تشکیل شده است و برای هر یک از این زیر قسمتها یک زیر الگوریتم ارائه می‌شود.

بهترین راه برای فائق آمدن بر این پیچدگی این است که زیر مساله ها و الگوریتمهای ارائه شده برای هر یک را در ی.ک سطح از انتزاع نگاه داریم.
با بررسی الگوریتمهای مختلف می‌توان به این حقیقت رسید که این الگوریتمها همگی ترکیبی از زیر الگوریتمهای محدودی هستند.

در حقیقت این زیر الگوریتمها نسخه‌های متفاوتی از دو تکنیک اصلی در کنترل همروندی توزیعی به نامهای قفل دو مرحله ای و ترتیب برچسب زمانی می‌باشند.
همانطور که گفته شد، هدف کنترل همروندی مقابله با تزاحمهایی است که در اثر استفاده چند کاربر از یک سری داده واحد برای کاربران بوجود می‌آید است.

حال ما با ارائه دو مثال در خصوص این مسائل بحث خواهیم نمود.

این دو مثال از محک معروف TPC_A مقتبس شده اند.

در این مثالها، یک سیستم اطلاعات را از پایگاه داده ها استخراج کرده و محاسبات لازم را انجام داده و در نهایت اطلاعات را در پایگاه داده ذخیره می‌نماید.

حالت اول را می‌توان بروزآوری از دست رفته نامید.

حالتی را تصور کنید که دو مشتری از دو سیستم مجزا بخواهند از یک حساب مالی برداشت نمایند.

در این حالت فرض کنید در غیاب سیستم کنترل همروندی، هر دو با هم اقدام به خواندن اطلاعات و درج اطلاعات جدید در سیستم میکنند.

در این حالت در غیاب سیستم کنترل همروندی تنها آخرین درج در سیستم ثبت می‌شود.

این حالت در شکل 1 نشان داده شده‌ است.
حالت اول را می‌توان بروزآوری از دست رفته نامید.

این حالت در شکل 1 نشان داده شده‌ است.

شکل 1 نمایش حالت بروز آوری از دست رفته حالت دوم حالتی است که در آن اطلاعات صحیح از پایگاه داده استخراج نمی‌شود.

در این حالت فرض کنید دو مشتری بخواهند کارهای ذیل را انجام دهند.

مشتری 1: بخواهد یک چک 1 میلیونی را به حساب X واریز و از حساب Y برداشت نماید.

مشتری 2: بخواهد بیلان حساب مالی X و Y شامل کل موجودی را نمایش دهد.

در غیاب کنترل همروندی همانطور که در شکل 2 نشان داده شده‌است، تزاحم بین پروسس ها بوجود خواهد آمد.

فرض کنید در زمانی که مشتری 1 اطلاعات را از حساب Y خوانده و اطلاعات حساب X را دریافت نموده و 1 میلیون از حساب Y برداشت نموده ولی هنوز 1 میلیون به حساب X و اریز نکرده مشتری 2 اطلاعات کل دو حساب را دریافت نموده و نتیجه را چاپ نماید.

در این حالت مشتری شماره 2 اطلاعاتی را که به عنوان بیلان نمایش می‌دهد 1 میلیون از مقدار واقعی کمتر است.

این حالت یک فرق اساسی با حالت اول دارد و آن این است که در این حالت نتیجه نهایی در پایگاه داده درست خواهد بود در حالیکه اطلاعات دریافت شده بصورت موقت غلط خواهند بود.

شکل 2 خواندن اطلاعات نادرست از سیستم مساله کنترل همروندی در پایگاه داده های توزیعی تا حدودی شبیه مساله دوبه‌دو ناسزگاری در سیستم عامل می‌باشد.

در مساله دوبه‌دو ناسازگاری، هماهنگی جهت دسترسی به منابع سیستم ائم از حافظه، ابزارهای ورودی و خروجی و CPU و ....

بوجود می‌آید.

در این حالت راه حلهای گوناگونی ائم از قفلها، سمافورها، مونیتورها و ...

پیشنهاد شده است.

کنرتل همروندی و دوبه‌دو ناسگاری از این جهت که هر دو دسترسی به منابع مشترک را کنترل میکنند با هم شباهت دارند.

با این حال راه حلی که برای یکی بکار می‌رود قابل بهره برداری برای دیگری نیست.

فرض کنید پردازه های P1 و P2 بخواهند از نقاط مختلف کدهای خود به منابع R1 و R2 دسترسی پیدا کنند.

در سیستم عامل دسترسی مجزای ذیل قابل قبول است.

P2 از R1 استفاده کند، P2 از R1 استفاده کند، P2 از R2 استفاده نموده و سپس P1 از R2 استفاده نماید.

در پایگاه داده این روند اجرا مورد قبول نیست و مشکلاتی را ایجاد می‌کند.

فرض کنید P1 بخواهد از R1 مبلغی را به R2 انتقال دهد.

در این حالت اگر P2 مقادیر R1 وR2 را چک کند مقادیر غیر صحیح را دریافت می‌کند.

2.

مدل پردازش تراکنش: برای اینکه روند اجرای عملیات در سیستمهای پایگاه داده های توزیعی برای خواننده مشخص شود ما در اینجا یک مدل از پایگاه داده‌های توزیعی را ارائه می‌دهیم.

سپس نحوه عملکرد مکانیزم کنترل همروندی را در این مدل بیان خواهیم نمود.

در این مدل پایگاه داده، یک پایگاه داده توزیعی مجموعه از سایتهاست که توسط یک شبکه به هم متصل شده‌اند.

هر سایت یک کامپیوتر است که یکی یا هر دوی برنامه های ذیل را اجرا می‌کند.

برنامه‌ها شامل یک مدیر تراکنش یا TM و یک مدیر داده یا DM است.

TM مسئول مدیریت تعامل کاربر با پایگاه داده است و DM مسئول نگهداری داده‌ها است.

شبکه نیز یک وسیله ارتباطی کامپیوتر – کامپیوتر است.

فرض بر این است که شبکه کاملا امن می‌باشد و پیامها را با همان ترتیبی که وارد سیستم می‌شوند به مقصد ارسال می‌شود.

فرض بر این است که تعداد داده های موجود در سیستم شامل X ، Y و Z است که داده های منطقی موجود در سیستم را تشکیل می‌دهند.

داده های ذکر شده فقط واحد داده های منطقی هستند و ما با سایز و قالب و جزئیات آنها کاری نخواهیم داشت.

هر پایگاه داده در این سیستم یک نسبت دهی مقادیر بصورت منطقی به این داده های منطقی است.

هر داده منطقی می‌تواند در یک یا بیشتر از یک DM ذخیره شود.

افزونگی داده در اثر ذخیره داده در چندین DM برای افزایش دسترسی به داده‌ها است.

هر کپی از داده ذخیره شده آیتم داده نامیده می‌شود.

نسخه های متعدد داده X را بصورت X1,X2,...

نشان داده می‌شوند.

کاربران با DDBMS از طریق اجرای تراکنشها تعامل دارند.

تراکنشها می‌توانند پرس و جو های on-line باشند که با زبان استاندارد پرس و جو ارسال شده اند.

از طرفی تراکنشها می‌توانند عملیاتی باشند که از طریق برنامه های نوشته شده به سیستم داده می‌شوند.

الگوریتمهای کنترل همروندی، کاری با نوع تراکنشهای موجود در سیستم ندارند و محاسبات انحام شده در این تراکنشها تاثیری در روند این الگوریتمها ندارد.

بر خلاف اینها این الگوریتمها تمام تصمیم گیری های خود را بر اساس داده هایی که این تراکنشها به آنها دسترسی پیدا می‌کنند انجام می‌دهند.

دسترسی ها می‌توانند از نوع خواندن یا نوشتن باشند.

فرض بر این است که محاسبات در تراکنشها کامل بوده و اگر تراکنش در یک پایگاه داده به تنهایی اجرا شود، پایگاه داده در حالت صحیح و مانا قرار گرفته و نتایج کاملا صحیحی در بر خواهد داشت.

مجموعه منطقی خواندنی یک تراکنش مجموعه ای از آیتمهای داده ای است که تراکنش می‌خواند.

این امر در شکل 3 نمایش داده شده است.

شکل 3 مدل اجرای تراکنشها صحت یک الگوریتم کنترل همروندی بر اساس نیاز کاربران به اجرای تراکنشها تعریف می‌شود.

در اینجا می‌توان دو شرط اساسی را می‌توان برای اجرای صحیح تراکنشها می‌توان در نظر گرفت.

شرط اول این است که کاربران انتظار دارند تراکنشهایی را که در سیستم ثبت می‌کنند، نهایتا اجرا شود.

شرط دو م این است که کاربران انتظار دارند تراکنشهای ارسالی دقیقا مانند زمانی که تراکنش در یک سیستم مجزا یا در یک محیط موازی چند برنامه، اجرا می‌شود اجرا شود و نتایج آن در هر دوحالت کاملا مشابه باشد.

تحقق این شرایط دقیقا اهداف یک الگوریتم کنترل همروندی را مشخص می‌کنند.

یک سیستم DDBMS چهار جزء اصلی را در برخواهد داشت: تراکنش، TM، DM و داده‌ها.

تراکنشها با TM ارتباط دارند.

TM ها با DM ها ارتباط برقرار می‌کنند و DM ها داده ها را مدیریت می‌کنند.

TM ها با سایر TM ها ارتباط برقرار نمی‌کنند.

TM ها بر ترکانش ها و اجرای آنها نظارت می‌کنند.

هر تراکنش در پایگاه داده های توزیعی فقط با یک TM در ارتباط است.

این بدین معنا است که هر تراکنش تمام عملیات پایگاه داده خود را به TM مربوط به خود ارسال می‌کنند.

تمامی عملیاتهای توزیعی که بایستی توسط تراکنش انجام شود توسط TM مزبور مدیریت می‌شود.

چهار عملیات مختلف توسط واسط TM برای تراکنشها قابل تعریف است.

read(x) مقدار جاری x را در وضعیت فعلی پایگاه داده های منطقی برمی‌گرداند.

write(x,newvalue) مقدار x را در حالت جاری پایگاه داده‌های منطقی به مقدار Newvalue تغییر می‌دهد.

همچنین با استفاده از begin و end ابتدا و انتهای یک تراکنش برای یک TM مشخص می‌شود.

3-تحلیل مساله کنترل همروندی : در اینجا ما با دو رویکرد به مواجه با مساله کنترل همروندی خواهیم پرداخت.

در رویکرد اول به نحوه اجرای صحیح خواهیم پرداخت و در رویکرد دوم به تجزیه مساله به بخشهای قابل حل خواهیم پرداخت.

3-1- قابلیت توالی: فرض کنید E یک ترتیب اجرای تراکنشهای t1 تا Tn باشد.

در اینصورت E یک اجرای متوالی از تراکنشها است، در صورتیکه هر تراکنش قبل از اجرای تراکنش بعدی به طور کامل اجرا شده و خاتمه پذیرد.

تمامی ترتیبهای اجرای متوالی از دیدگاه پایگاه داده‌ها صحیح تصور می‌شوند، چرا که خواص تراکنش اذعان می‌کند که در خاتمه اجرای متوالی صحت پایگاه داده حفظ می‌شود.

یک ترتیب اجرای تراکنش قابل توالی (Serializable) محسوب می‌شود در صورتیکه نتیجه خروجی اجرای آن برابر یک اجرای متوالی از تراکنشهای مشابه باشد.

در نتیجه تمام اجراهای متوالی serializable محسوب می‌شوند و نتیجه صحیحی خواهند داشت.

هدف الگوریتم کنترل همروندی این است که تضمین کند که تمامی ترتیب های اجرای تراکنش ها قابل توالی می‌باشند.

تنها عملیاتی که به داده‌های پایگاه داده دسترسی پیدا میکنند dm-read و dm-write می‌باشند.

بنا براین برای پایش اجرای توالی لازم است فقط dm-read و dm-write های موجود در پایگاه داده توزیعی در dm ها مختلف مدل شده و رفتار آنها کنترل شود.

log فایلها می‌توانند شرح دهنده توالی dm-read ها و Dm-write ها باشند.

در یک پایگاه داده توزیعی، یک ترتیب اجرا قابل توالی نامیده میشود در صورتیکه به ازای Ti که قبل از tj در توالی قرار دارد، تمامی عملیاتهای Ti قبل از tj در تمامی سایتها انجام شده باشند.

این نشان دهنده این است که تمامی تراکنشها باید به ترتیب وارد شده در تمامی سایتها اجرا شوند.

دو عملیات با هم تداخل دارند اگر هر دو عملیات بر روی یک داده مشترک کار کرده و یکی از داده ها dm-write باشد.

در این حالت اگر دو عملیات با هم تداخل داشته باشند، ترتیب اجرای دو عمل بر روی نتیجه نهایی تاثیر مستقیم خواهد داشت.

برای روشنتر شدن موضوع به بحث در خصوص یک مثال خواهیم پرداخت.

فرض کنید ایتم داده‌ای x و تراکنشهای ti و Tj موجود باشند.

اگر ti اقدام به خواندن مقدار X نموده و tj اقدام به نوشتن مقدار جدیدی در x نماید.

در اینصورت مقدار خوانده شده

کلمات کلیدی: الگوریتم - پایگاه داده ها

تحقیق دانش آموزی در مورد دانلود مقاله الگوریتم (پایگاه داده ها), مقاله دانشجویی با موضوع دانلود مقاله الگوریتم (پایگاه داده ها), پروژه دانشجویی درباره دانلود مقاله الگوریتم (پایگاه داده ها)

دانلود گزارش درس پایگاه داده های پیشرفته 2: داده کاوی

کامپیوتر - IT ۳۸

مقدمه ای بر داده‌کاوی در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند [‎1]. بطور کلی استفاده همگانی ...

دانلود ‫پروژه بهینه سازی تقاضا تحت رتبه بندی در سیستمهای مدیریت پایگاه داده

کامپیوتر - IT ۷۴

بهینه سازی تقاضا یکی از مسائل مهم در سیستمهای مدیریت پایگاه داده می باشد. در سالهای اخیر بهینه سازی تقاضا از جنبه های مختلفی مورد بررسی قرار گرفته است که به تفصیل در فصل 2 بیان شده است. مقوله ای که مورد بررسی انجام دادیم بهینه سازی تقاضا تحت رتبه بندی می باشد که برای بدست آوردن Kجواب بهتر در یک تقاضا است که K توسط تقاضا تعیین می شود. 1- انگیزه تحقیق پدیدار شدن برنامه های کاربردی ...

دانلود مقاله حافظه اصلی پایگاه داده ها

کامپیوتر - IT ۳۹

در اواسط دهه 1980، با نزول قیمت DRAM، این ایده مطرح شد که کامپیوترهای آتی با داشتن حافظه اصلی با ظرفیت بالا، می توانند بسیاری از پایگاه داده ها را درحافظه اصلی داشته باشند. در این شرایط می توان همه I/O ها (که بسیار هزینه بر می باشند) را از پردازش DBMS حذف نمود. بنابراین معماری DBMS دستخوش تغییرات جدی می شود و در یک MAIN MEMORY DBMS(MMDBMS)، مدیریت I/O دیگر نقشی نخواهد داشت. نکته ...

دانلود تحقیق رایگان پایگاه داده

دانلود مقاله های رایگان ۵

یک سیستم کامپیوتری که هدف آن ذخیره اطلاعات است و کاربران می توانند آن اطلاعات بازیابی یا به هنگام سازی کنند و میتوان علت استفاده از بانک اطلاعاتی در فشردگی ، سرعت بالا ، بودجه کمتر ، دسترسی راحتر و حفاظت بهتر دانست .هر سیستم بانک اطلاعاتی از 4 مولفه تشکیل شده است : داده ها • سخت افزار • نرم افزار • کاربران و سیستم های پایگاه داده به شیوه های مختلفی ساخته می شوند سیستم های رابطه ...

دانلود تحقیق شبکه های عصبی و الگوریتم های ژنتیک در تجارت

اقتصاد - حسابداری - مدیریت ۱۱

چکیده: در عصر حاضر در بسیاری از موارد ماشین ها جایگزین انسانها شده اند و بسیاری از کارهای فیزیکی که در گذشته توسط انسانها انجام می گرفت امروزه توسط ماشین ها صورت می گیرد . اگرچه قدرت کامپیوترها در ذخیره، بازیابی اطلاعات و اتوماسیون اداری ،.. غیر قابل انکار است، اما همچنان مواردی وجود دارد که انسان ناچار است خودش کارها را انجام دهد. اما به طور کلی ، موارد مرتبط با ماشین شامل ...

دانلود گزارش کارآموزی پایگاه داده

کامپیوتر - IT ۵۰

چندی است که اصلاحاتی همچون سیستم مدیریت بانک های اطلاعاتی و بانکهای اطلاعاتی و پایگاه داده ها و نظایر آن نقل محافل علمی-فنی و علمی است. اینک حتی وضع چنان است که به خاطر ریزپردازنده ها و انواع آن نرم افزارهای سهل الاستفاده روی کامپیوتر های شخصی، هرکسی می تواند بانک اطلاعاتی شخصی خود را داشته بلشد. مبالغه نیست ، اگر گفته شود که دیگر لزومی نیست کسی در رشته کامپیوترتحصیل و یا در ...

دانلود مقاله یک الگوریتم ژنتیک جدید همراه با بازچینی مجدد ژن ها برای خوشه بندی داده ها

کامپیوتر - IT ۱۵

در این گزارش ما یک روش جدید برای خوشه بندی داده ها بر پایه الگوریتم ژنتیک همراه با بازچینی مجدد ژن های هر کروموزوم در هر مرحله تکرار ارائه می دهیم.این امر باعث حذف انحطاط در مراکز خوشه ها در هر مرحله می شود در این گزارش یک عملگر ترکیب (crossover) جدید تعریف شده است که از میزان شباهت بین کروموزوم ها استفاده می کند.احتمال ترکیب و جهش در هر مرحله به صورت وفقی محاسبه می شود تا ...

دانلود مقاله بهبود شناسایی آرم در سند های تصویری مبتنی بر الگوریتم ژنتیک

کامپیوتر - IT ۹

چکیده -تشخیص آرم یکی از راه های تشخیص منابع اسنادو اطلاعاتی درباره یک سند می باشد.در این مقاله شناسایی و تشخیص آرم ها در تصاویر متنی بیان می شود.بدین صورت که ابتدا تصاویر به سگمنت هایی تقسیم شده ، توسط فاز تشخیص آرم، برای هر سگمنت ویژگی هایی بر پایه آمار اولیه در مورد مؤلفه های پیکسل های سیاه درون هر بخش محاسبه می شود.با استفاده از این ویژگی ها، شبکه عصبی تکاملی بر پایه الگوریتم ...

دانلود مقاله سیستم های خبره

کامپیوتر - IT ۱۲

سیستم‌های خبره شاخه‌ای از علم نسبتاً جدید هوشی مصنوعی می‌باشند. Charmonand king / 1985 , keller / 1987 , rouch – hindin / 1985 , bonnet / 1985 rouch – hindin 1986 (a) , rauch – hindin /1986 (b) , charniackandmcdermon 1985 watermun/ 19876 و این سیستم ها در سطوح دستیاری ، مشاوره و تخصص عمل می‌کنند ( شکل 1) شکل 1-هوش مصنوعی و شاخه های ان سیستم‌های خبره برای تقلید عملکرد یک فرد ...

دانلود تحقیق موتورهای جستجوگر

کامپیوتر - IT ۲۴

با پیشرفت بشر در زمینه‌های مختلف علمی و افزایش سطح آگاهی انسان درباره پدیده‌های مختلف و البته نیاز رو به گسترش ما به دانش و اطلاعات در این عصر زمینه برای بروز پدید‌ه‌های مختلفی که بتواند خواسته‌های علمی و اطلاع رسانی انسان را برای برآورده‌ سازد افزایش یافته است . با ساخت کامپیوتر در اواسط قرن گذشته مقداری از نیازهای انسان برآورده شد با گذشت زمان این دستگاه در قسمتهای مختلف جامعه ...

ثبت سفارش