فهرست بندی یک روش ساختار داده است که به شما امکان می دهد به سرعت سوابق را از یک فایل پایگاه داده بازیابی کنید. یک شاخص یک جدول کوچک است که فقط دو ستون دارد. ستون اول شامل یک نسخه از کلید اصلی یا نامزد یک جدول است. ستون دوم آن حاوی مجموعه ای از نشانگرها برای نگه داشتن آدرس بلوک دیسک است که در آن مقدار کلید خاص ذخیره شده است.
- یک کلید جستجو را به عنوان ورودی می گیرد
- به طور کارآمد مجموعه ای از سوابق تطبیق را برمی گرداند.
در این آموزش فهرست بندی DBMS ، شما یاد خواهید گرفت:
انواع نمایه سازی در DBMS
نمایه سازی در پایگاه داده بر اساس ویژگی های نمایه سازی آن تعریف شده است. دو نوع اصلی روش نمایه سازی عبارتند از:
- فهرست بندی اصلی
- نمایه ثانویه
شاخص اصلی در DBMS
شاخص اولیه یک فایل سفارش داده شده است که اندازه آن با دو قسمت ثابت است. قسمت اول همان کلید اصلی است و دوم ، به آن بلوک داده خاص اشاره شده است. در شاخص اصلی ، همیشه یک یا یک رابطه بین ورودی ها در جدول فهرست وجود دارد.
نمایه سازی اولیه در DBMS نیز به دو نوع تقسیم می شود.
- شاخص متراکم
- شاخص پراکنده
شاخص متراکم
در یک شاخص متراکم ، یک رکورد برای هر کلید جستجو که در پایگاه داده ارزش دارد ایجاد می شود. این به شما کمک می کند تا سریعتر جستجو کنید اما به فضای بیشتری برای ذخیره سوابق فهرست نیاز دارید. در این فهرست بندی ، سوابق متد حاوی مقدار کلید جستجو و نقص به ضبط واقعی روی دیسک است.
شاخص پراکنده
این یک رکورد شاخص است که فقط برای برخی از مقادیر موجود در پرونده ظاهر می شود. شاخص پراکنده به شما کمک می کند تا مسائل مربوط به نمایه سازی متراکم در DBMS را حل کنید. در این روش تکنیک نمایه سازی ، طیف وسیعی از ستون های شاخص همان آدرس بلوک داده را ذخیره می کنند و در صورت نیاز به بازیابی داده ها ، آدرس بلوک به دست می آید.
با این حال ، شاخص پراکنده سوابق فهرست را فقط برای برخی از مقادیر کلید جستجو ذخیره می کند. برای قرار دادن سوابق ، به فضای کمتری ، سربار تعمیر و نگهداری کمتر و حذف نیاز دارد اما در مقایسه با شاخص متراکم کندتر است.
در زیر یک شاخص پایگاه داده از شاخص پراکنده آورده شده است
شاخص ثانویه در DBMS
شاخص ثانویه در DBMS می تواند توسط فیلد ایجاد شود که برای هر رکورد یک مقدار منحصر به فرد دارد و باید یک کلید کاندید باشد. همچنین به عنوان یک شاخص غیر خوشه ای شناخته می شود.
این روش نمایه سازی پایگاه داده دو سطح برای کاهش اندازه نقشه برداری سطح اول استفاده می شود. برای سطح اول ، تعداد زیادی از اعداد به همین دلیل انتخاب می شوند. اندازه نقشه برداری همیشه کوچک است.
مثال شاخص ثانویه
بیایید نمایه سازی ثانویه را با یک مثال شاخص پایگاه داده درک کنیم:
در یک پایگاه داده حساب بانکی ، داده ها به صورت متوالی توسط ACC_NO ذخیره می شوند. ممکن است بخواهید همه حساب ها را در یک شعبه خاص از ABC Bank پیدا کنید.
در اینجا ، برای هر کلید جستجو می توانید یک شاخص ثانویه در DBMS داشته باشید. Record Index یک نکته ضبط شده برای یک سطل است که حاوی نشانگرهایی برای همه سوابق با ارزش جستجوی خاص آنها است.
شاخص خوشه بندی در DBMS
در یک فهرست خوشه ای ، سوابق خود در این فهرست ذخیره می شوند و نه نشانگرها. گاهی اوقات این شاخص در ستون های کلیدی غیر مقدماتی ایجاد می شود که ممکن است برای هر رکورد منحصر به فرد نباشد. در چنین شرایطی ، می توانید دو یا چند ستون گروه بندی کنید تا مقادیر منحصر به فرد را بدست آورید و شاخصی ایجاد کنید که به آن شاخص خوشه ای گفته می شود. این همچنین به شما کمک می کند تا رکورد را سریعتر شناسایی کنید.
مثال:
بیایید فرض کنیم که یک شرکت بسیاری از کارمندان را در بخش های مختلف استخدام کرده است. در این حالت ، نمایه سازی خوشه بندی در DBMS باید برای کلیه کارمندانی که متعلق به همان گروه هستند ایجاد شود.
این در یک خوشه واحد در نظر گرفته می شود ، و نقاط شاخص به کل خوشه اشاره می کنند. در اینجا ، بخش _no یک کلید غیر منحصر به فرد است.
شاخص چند سطحی چیست؟
نمایه سازی چند سطحی در پایگاه داده ایجاد می شود که یک شاخص اصلی در حافظه جای نمی گیرد. در این نوع روش نمایه سازی ، می توانید تعداد دسترسی های دیسک را به هر رکورد کوتاه کاهش داده و به عنوان یک فایل پی در پی روی دیسک نگه دارید و یک پایه پراکنده در آن پرونده ایجاد کنید.
شاخص درخت B
شاخص B-Tree ساختار داده های گسترده ای برای نمایه سازی درخت در DBMS است. این یک قالب چند سطحی از فهرست بندی های مبتنی بر درخت در تکنیک DBMS است که دارای درختان جستجوی باینری متعادل است. تمام گره های برگ درخت B نشانگر نشانگر داده های واقعی است.
علاوه بر این ، تمام گره های برگ با یک لیست پیوند به هم پیوسته اند ، که به یک درخت B اجازه می دهد تا از دسترسی تصادفی و پی در پی پشتیبانی کند.