أكثر

كيفية إجراء استعلام SQL باستخدام .STContains in MS SQL Server

كيفية إجراء استعلام SQL باستخدام .STContains in MS SQL Server


لدي جدول يخزن المضلعات وجدول يخزن النقاط بحقل قيمة. يتم تخزين مجموعتي البيانات باستخدام النوع الهندسي في MS SQL Server.

لدي مطلب بسيط - أحتاج إلى استرداد سجلات النقاط الموجودة داخل المضلعات ثم جمع النتيجة بناءً على حقل القيمة في جدول النقاط. لذلك ، تكون النتيجة النهائية للاستعلام عبارة عن عمودين: - أسماء المضلعات - مجموع حقل القيمة في جدول النقاط

إعلانarea GEOMETRY = (اختر الشكل من GREENFIELDAREAS WHERE AREANAME = 'Aerodrome') حدد NETDWELLINGS ، الشكل من ORA_NETDWELLINGCOMPLETIONS WHERE @ area.STIntersects (Shape) = 1

يعرض الاستعلام أعلاه الأشكال الهندسية للنقاط ولكن فقط لمضلع واحد (مطار). ما أحتاجه هو جمع NETDWELLINGS وإرجاع هذه القيمة لجميع المضلعات.


حدد g.id ، SUM (o.netdwellings) كمجموع من g ، o حيث g.geom.STIntersects (o.geom) = مجموعة واحدة بواسطة g.id

سيؤدي ذلك إلى إرجاع مجموع كل ذرات o التي تتقاطع مع g.geom. (هل فهمت السؤال بشكل خاطئ؟)


إدارة استوديو System.OutOfMemoryException

أنا أستخدم Microsoft SQL Server 2012 وأحاول تشغيل استعلام بسيط مقابله داخل Management Studio. أتلقى الخطأ التالي (في SSMS ، يعمل على الخادم):

حدث خطأ أثناء تنفيذ الدفعة. رسالة الخطأ هي: تم طرح استثناء من النوع "System.OutOfMemoryException".

يحتوي النظام على 24 جيجابايت من ذاكرة الوصول العشوائي مثبتة ولكن بالنظر في مدير المهام ، فإن عملية sqlservr.exe تستخدم 2.9 جيجابايت فقط.

هل هناك إعداد في مكان ما يقيد استخدام ذاكرة الوصول العشوائي الخاصة به؟


حول الفهارس المكانية

تفكيك المساحة المفهرسة إلى تسلسل هرمي للشبكة

في SQL Server ، يتم إنشاء الفهارس المكانية باستخدام أشجار B ، مما يعني أن الفهارس يجب أن تمثل البيانات المكانية ثنائية الأبعاد بالترتيب الخطي لأشجار B. لذلك ، قبل قراءة البيانات في فهرس مكاني ، يطبق SQL Server تحللًا موحدًا هرميًا للمساحة. عملية إنشاء الفهرس يتحلل الفضاء إلى أربعة مستويات التسلسل الهرمي للشبكة. يشار إلى هذه المستويات باسم المستوى 1 (المستوى الأعلى) ، المستوي 2, مستوى 3، و مستوى 4.

يؤدي كل مستوى متتالي إلى تفكيك المستوى فوقه ، بحيث تحتوي كل خلية في المستوى الأعلى على شبكة كاملة في المستوى التالي. على مستوى معين ، تحتوي جميع الشبكات على نفس عدد الخلايا على طول كلا المحورين (على سبيل المثال ، 4x4 أو 8x8) ، وتكون جميع الخلايا بحجم واحد.

يوضح الرسم التوضيحي التالي تحلل الخلية العلوية اليمنى عند كل مستوى من التسلسل الهرمي للشبكة في شبكة 4x4. في الواقع ، تتحلل جميع الخلايا بهذه الطريقة. وهكذا ، على سبيل المثال ، فإن تحليل مساحة إلى أربعة مستويات من شبكات 4x4 ينتج فعليًا إجمالي 65.536 خلية من المستوى الرابع.

يعتبر تحلل المساحة لمؤشر مكاني مستقلاً عن وحدة القياس التي تستخدمها بيانات التطبيق.

يتم ترقيم خلايا التسلسل الهرمي للشبكة بطريقة خطية باستخدام تباين منحنى ملء مساحة هيلبرت. لغرض التوضيح ، ومع ذلك ، تستخدم هذه المناقشة ترقيمًا بسيطًا للصفوف ، بدلاً من الترقيم الذي تم إنتاجه بالفعل بواسطة منحنى هيلبرت. في الرسم التوضيحي التالي ، تم بالفعل وضع العديد من المضلعات التي تمثل المباني والخطوط التي تمثل الشوارع في شبكة 4x4 من المستوى 1. يتم ترقيم خلايا المستوى 1 من 1 إلى 16 ، بدءًا من الخلية العلوية اليسرى.

كثافة الشبكة

يحدد عدد الخلايا على طول محاور الشبكة كثافة: كلما زاد الرقم ، زادت كثافة الشبكة. على سبيل المثال ، شبكة 8x8 (التي تنتج 64 خلية) ، تكون أكثر كثافة من شبكة 4x4 (التي تنتج 16 خلية). يتم تحديد كثافة الشبكة على أساس كل مستوى.

تدعم عبارة CREATE SPATIAL INDEXTransact-SQL جملة GRIDS التي تمكنك من تحديد كثافات مختلفة للشبكة على مستويات مختلفة. يتم تحديد كثافة الشبكة لمستوى معين باستخدام إحدى الكلمات الأساسية التالية.

الكلمة الرئيسية تكوين الشبكة عدد الخلايا
قليل 4 × 4 16
وسط 8 × 8 64
متوسط 16 × 16 256

في SQL Server ، عند ضبط مستوى توافق قاعدة البيانات على 100 أو أقل ، يكون المستوى الافتراضي هو المتوسط ​​على جميع المستويات. عند تعيين مستوى توافق قاعدة البيانات على 110 أو أعلى ، يكون الإعداد الافتراضي هو مخطط شبكة تلقائي. (تشير الشبكة التلقائية إلى تكوين 8 مستويات لـ HLLLLLLL.) بدلاً من تغيير كثافة شبكة الفهرس ، يمكنك تغيير الخلايا لكل كائن والاستعلام عن خلايا النافذة لكل كائن عبر تلميح.

يمكنك التحكم في عملية التحلل عن طريق تحديد كثافات الشبكة غير الافتراضية. على سبيل المثال ، قد تكون كثافات الشبكة المختلفة على مستويات مختلفة مفيدة لضبط فهرس بناءً على حجم المساحة المفهرسة والكائنات الموجودة في العمود المكاني.

تظهر كثافات الشبكة للفهرس المكاني في أعمدة level_1_grid و level_2_grid و level_3_grid و level_4_grid لعرض كتالوج sys.spatial_index_tessellations عند تعيين مستوى توافق قاعدة البيانات على 100 أو أقل. ال GEOMETRY_AUTO_GRID/GEOGRAPHY_AUTO_GRID خيارات مخطط التغطية بالفسيفساء لا تملأ هذه الأعمدة. عرض الكتالوج sys.spatial_index_tessellations به باطل قيم هذه الأعمدة عند استخدام خيارات الشبكة التلقائية.

التغطية بالفسيفساء

بعد تحلل مساحة مفهرسة إلى تسلسل هرمي للشبكة ، يقرأ الفهرس المكاني البيانات من العمود المكاني ، صفًا بصف. بعد قراءة البيانات الخاصة بكائن مكاني (أو مثيل) ، يقوم الفهرس المكاني بتنفيذ ملف عملية التغطية بالفسيفساء لهذا الكائن. تلائم عملية التغطية بالفسيفساء الكائن في التسلسل الهرمي للشبكة عن طريق ربط الكائن بمجموعة من خلايا الشبكة التي يلامسها (لمس الخلايا). بدءًا من المستوى 1 من التسلسل الهرمي للشبكة ، تستمر عملية التغطية بالفسيفساء اتساع أولا عبر المستوى. من المحتمل أن تستمر العملية من خلال جميع المستويات الأربعة ، مستوى واحد في كل مرة.

ناتج عملية التغطية بالفسيفساء عبارة عن مجموعة من الخلايا التي تم لمسها والتي يتم تسجيلها في الفهرس المكاني للكائن. بالإشارة إلى هذه الخلايا المسجلة ، يمكن للفهرس المكاني تحديد موقع الكائن في الفضاء بالنسبة للكائنات الأخرى في العمود المكاني المخزنة أيضًا في الفهرس.

قواعد التغطية بالفسيفساء

للحد من عدد الخلايا التي تم لمسها والتي يتم تسجيلها لكائن ما ، تطبق عملية التغطية بالفسيفساء عدة قواعد للفسيفساء. تحدد هذه القواعد عمق عملية التغطية بالفسيفساء وأي الخلايا التي تم لمسها مسجلة في الفهرس.

هذه القواعد هي كما يلي:

إذا كان الكائن يغطي خلية بالكامل ، فيُقال أن هذه الخلية هي مغطى بالكائن. تحسب الخلية المغطاة ولا يتم تغطيتها بالفسيفساء. تنطبق هذه القاعدة على جميع مستويات التسلسل الهرمي للشبكة. تعمل قاعدة التغطية على تبسيط عملية التغطية بالفسيفساء وتقليل كمية البيانات التي يسجلها الفهرس المكاني.

هذه القاعدة تفرض حد الخلايا لكل كائن، والتي تحدد الحد الأقصى لعدد الخلايا التي يمكن عدها لكل كائن ، باستثناء المستوى 1. في المستويات الأدنى ، تتحكم قاعدة الخلايا لكل كائن في مقدار المعلومات التي يمكن تسجيلها حول الكائن.

تُنشئ قاعدة الخلية الأعمق أفضل تقريب للكائن عن طريق تسجيل معظم الخلايا السفلية التي تم تغطيتها بالفسيفساء للكائن. لا تساهم الخلايا الأصلية في عدد الخلايا لكل كائن ، ولا يتم تسجيلها في الفهرس.

يتم تطبيق قواعد التغطية بالفسيفساء بشكل متكرر على كل مستوى شبكة. يصف الجزء المتبقي من هذا القسم قواعد التغطية بالفسيفساء بمزيد من التفصيل.

تغطية القاعدة

إذا كان كائن ما يغطي خلية بالكامل ، فيُقال أن هذه الخلية هي مغطى بالكائن. على سبيل المثال ، في الرسم التوضيحي التالي ، إحدى خلايا المستوى الثاني ، وهي 15.11 ، مغطاة بالكامل بالجزء الأوسط من ثماني أضلاع.

يتم عد الخلية المغطاة وتسجيلها في الفهرس ، ولا يتم فصل الخلية بالفسيفساء بعد ذلك.

قاعدة الخلايا لكل كائن

يعتمد مدى التغطية بالفسيفساء لكل كائن بشكل أساسي على حد الخلايا لكل كائن من الفهرس المكاني. يحدد هذا الحد الحد الأقصى لعدد الخلايا التي يمكن للفسيفساء عدها لكل كائن. لاحظ ، مع ذلك ، أن قاعدة الخلايا لكل كائن لا يتم فرضها للمستوى 1 ، لذلك من الممكن تجاوز هذا الحد. إذا وصل تعداد المستوى 1 إلى حد الخلايا لكل كائن أو تجاوزه ، فلن يحدث مزيد من التغطية بالفسيفساء في المستويات الأدنى.

طالما أن العدد أقل من حد الخلايا لكل كائن ، تستمر عملية التغطية بالفسيفساء. بدءًا من الخلية الأقل عددًا التي تم لمسها (على سبيل المثال ، الخلية 15.6 في الرسم التوضيحي السابق) ، تختبر العملية كل خلية لتقييم ما إذا كان سيتم عدها أو تغطيتها بالفسيفساء. إذا تجاوزت تغطية خلية بالفسيفساء حد الخلايا لكل كائن ، فسيتم حساب الخلية ولا يتم تشكيلها بالفسيفساء. خلاف ذلك ، تكون الخلية موزعة بالفسيفساء ، ويتم حساب خلايا المستوى الأدنى التي تم لمسها بواسطة الكائن. تستمر عملية التغطية بالفسيفساء بهذه الطريقة ، من حيث الاتساع ، عبر المستوى. تتكرر هذه العملية بشكل متكرر للشبكات ذات المستوى الأدنى من الخلايا المكسوة بالفسيفساء حتى يتم الوصول إلى الحد الأقصى أو لا توجد خلايا أخرى للعد.

على سبيل المثال ، ضع في اعتبارك الرسم التوضيحي السابق ، والذي يُظهر الشكل الثماني الذي يتناسب تمامًا مع الخلية 15 من شبكة المستوى 1. في الشكل ، تم تقسيم الخلية 15 بالفسيفساء ، مما أدى إلى تشريح المثمن إلى تسع خلايا من المستوى 2. يفترض هذا الرسم التوضيحي أن حد الخلايا لكل كائن هو 9 أو أكثر. إذا كان حد الخلايا لكل كائن 8 أو أقل ، فإن الخلية 15 لن تكون موزعة بالفسيفساء ، وسيتم حساب تلك الخلية 15 فقط للكائن.

بشكل افتراضي ، يكون حد الخلايا لكل كائن هو 16 خلية لكل كائن ، مما يوفر مفاضلة مرضية بين المساحة والدقة لمعظم الفهارس المكانية. ومع ذلك ، فإن عبارة CREATE SPATIAL INDEXTransact-SQL تدعم CELLS_PER_OBJECT = ن عبارة تمكّنك من تحديد عدد خلايا لكل كائن بين 1 و 8192 ، ضمناً.

ال خلايا_ لكل كائن يكون إعداد الفهرس المكاني مرئيًا في عرض كتالوج sys.spatial_index_tessellations.

قاعدة أعمق خلية

تستغل قاعدة الخلية الأعمق حقيقة أن كل خلية ذات مستوى أدنى تنتمي إلى الخلية الموجودة فوقها: تنتمي خلية المستوى 4 إلى خلية المستوى 3 ، وخلية المستوى 3 تنتمي إلى خلية المستوى 2 ، والمستوى -2 خلية تنتمي إلى خلية المستوى 1. على سبيل المثال ، ينتمي الكائن الذي ينتمي إلى الخلية 1.1.1.1 أيضًا إلى الخلية 1.1.1 والخلية 1.1 والخلية 1. يتم تضمين معرفة علاقات التسلسل الهرمي للخلايا في معالج الاستعلام. لذلك ، لا يلزم تسجيل سوى الخلايا ذات المستوى الأعمق في الفهرس ، مما يقلل من المعلومات التي يحتاجها الفهرس لتخزينها.

في الرسم التوضيحي التالي ، يوجد مضلع صغير نسبيًا على شكل معين مغطى بالفسيفساء. يستخدم الفهرس الحد الافتراضي للخلايا لكل كائن وهو 16 ، والذي لم يتم الوصول إليه لهذا الكائن الصغير. لذلك ، تستمر عملية التغطية بالفسيفساء إلى المستوى 4. يتواجد المضلع في المستوى التالي من المستوى 1 إلى المستوى 3: 4 و 4.4 و 4.4.10 و 4.4.14. ومع ذلك ، باستخدام قاعدة أعمق خلية ، فإن التغطية بالفسيفساء تحسب فقط الخلايا الاثني عشر من المستوى 4: 4.4.10.13-15 و 4.4.14.1-3 و 4.4.14.5-7 و 4.4.14.9-11.

مخططات التغطية بالفسيفساء

يعتمد سلوك الفهرس المكاني جزئيًا على ذلك مخطط التغطية بالفسيفساء. مخطط التغطية بالفسيفساء محدد بنوع البيانات. في SQL Server ، تدعم الفهارس المكانية مخططين للفسيفساء:

تغطية شبكة الهندسة بالفسيفساء، وهو مخطط لـ الهندسة نوع البيانات.

الجغرافيا شبكة التغطية بالفسيفساء، والذي ينطبق على أعمدة جغرافية نوع البيانات.

ال التغطية بالفسيفساء يكون إعداد الفهرس المكاني مرئيًا في عرض كتالوج sys.spatial_index_tessellations.

مخطط هندسة الشبكة بالفسيفساء

GEOMETRY_AUTO_GRID التغطية بالفسيفساء هي مخطط التغطية بالفسيفساء الافتراضي لـ الهندسة نوع البيانات لـ SQL Server 2012 (11.x) والإصدارات الأحدث. إن التغطية بالفسيفساء GEOMETRY_GRID هي مخطط التغطية بالفسيفساء الوحيد المتاح لأنواع البيانات الهندسية في SQL Server 2008. يناقش هذا القسم جوانب التغطية بالفسيفساء للشبكة الهندسية ذات الصلة بالعمل مع الفهارس المكانية: الأساليب المدعومة والمربعات المحيطة.

يمكنك تحديد نظام التغطية بالفسيفساء هذا بشكل صريح باستخدام جملة USING (GEOMETRY_AUTO_GRID / GEOMETRY_GRID) من عبارة CREATE SPATIAL INDEX Transact-SQL.

الصندوق المحيط

تحتل البيانات الهندسية مستوى يمكن أن يكون لانهائيًا. ومع ذلك ، في SQL Server ، يتطلب الفهرس المكاني مساحة محدودة. لإنشاء مساحة محدودة للتحلل ، يتطلب مخطط تغطية الشبكة الهندسية بالفسيفساء مستطيلاً المربع المحيط. يتم تحديد المربع المحيط بأربعة إحداثيات ، (س مين,ص دقيقة) و (اكس ماكس,ص ماكس)، والتي يتم تخزينها كخصائص للفهرس المكاني. تمثل هذه الإحداثيات ما يلي:

س مين هو إحداثي x للركن الأيسر السفلي من المربع المحيط.

ص دقيقة هو إحداثي ص للركن الأيسر السفلي.

اكس ماكس هو إحداثي x للركن الأيمن العلوي.

ص ماكس هو إحداثي ص للركن الأيمن العلوي.

يتم تحديد هذه الإحداثيات بواسطة جملة BOUNDING_BOX من عبارة CREATE SPATIAL INDEXTransact-SQL.

ال (س مين,ص دقيقة) و (اكس ماكس,ص ماكس) إحداثيات تحدد موضع وأبعاد الصندوق المحيط. يتم التعامل مع المساحة الموجودة خارج المربع المحيط كخلية مفردة مرقمة بصفر.

يحلل الفهرس المكاني المساحة داخل الصندوق المحيط. تملأ شبكة المستوى 1 من التسلسل الهرمي للشبكة المربع المحيط. لوضع كائن هندسي في التسلسل الهرمي للشبكة ، يقارن الفهرس المكاني إحداثيات الكائن بإحداثيات الصندوق المحيط.

يوضح الرسم التوضيحي التالي النقاط المحددة بواسطة (س مين,ص دقيقة) و (اكس ماكس,ص ماكس) إحداثيات المربع المحيط. يظهر المستوى الأعلى للتسلسل الهرمي للشبكة كشبكة 4x4. لغرض التوضيح ، تم حذف المستويات الدنيا. يشار إلى المسافة خارج المربع المحيط بصفر (0). لاحظ أن الكائن "أ" يمتد جزئيًا إلى ما وراء المربع ، وأن الكائن "ب" يقع تمامًا خارج المربع في الخلية 0.

يتوافق المربع المحيط مع جزء من البيانات المكانية للتطبيق. ما إذا كان المربع المحيط بالفهرس يحتوي بالكامل على البيانات المخزنة في العمود المكاني ، أو يحتوي على جزء فقط ، فهذا أمر متروك للتطبيق. فقط العمليات المحسوبة على الكائنات الموجودة بالكامل داخل الصندوق المحيط تستفيد من الفهرس المكاني. لذلك ، للحصول على أكبر ميزة من الفهرس المكاني على الهندسة العمود ، تحتاج إلى تحديد المربع المحيط الذي يحتوي على كل الكائنات أو معظمها.

تكون كثافات شبكة الفهرس المكاني مرئية في أعمدة bounding_box_xmin و bounding_box_ymin ، و bounding_box_xmax ، و bounding_box_ymax لعرض كتالوج sys.spatial_index_tessellations.

مخطط شبكة الجغرافيا بالفسيفساء

ينطبق مخطط التغطية بالفسيفساء هذا فقط على أ جغرافية عمودي. يلخص هذا القسم الطرق التي تدعمها شبكة الجغرافيا بالفسيفساء ويناقش كيفية عرض الفضاء الجيوديسي على مستوى ، والذي يتحلل بعد ذلك إلى تسلسل هرمي للشبكة.

يمكنك تحديد نظام التغطية بالفسيفساء هذا بشكل صريح باستخدام جملة USING (GEOGRAPHY_AUTO_GRID / GEOGRAPHY_GRID) من عبارة CREATE SPATIAL INDEXTransact-SQL.

إسقاط الفضاء الجيوديسي على مستوى

الحسابات على جغرافية الأمثلة (الكائنات) تعامل الفضاء الذي يحتوي على الكائنات على أنه شكل بيضاوي جيوديسي. لتحلل هذه المساحة ، يقسم مخطط التغطية بالفسيفساء لشبكة الجغرافيا سطح الشكل الإهليلجي إلى نصفي الكرة الأرضية العلوي والسفلي ، ثم ينفذ الخطوات التالية:

تصور كل نصف كروي على جوانب هرم رباعي الأضلاع.

يسطح الهرمين.

ينضم إلى الأهرامات المفلطحة لتشكيل طائرة غير إقليدية.

يوضح الرسم التوضيحي التالي عرضًا تخطيطيًا لعملية التحلل المكونة من ثلاث خطوات. في الأهرامات ، تمثل الخطوط المنقطة حدود الجوانب الأربعة لكل هرم. توضح الخطوتان 1 و 2 الشكل الإهليلجي الجيوديسي ، باستخدام خط أفقي أخضر لتمثيل خط خط العرض الاستوائي وسلسلة من الخطوط الرأسية الخضراء لتمثيل عدة خطوط طول. توضح الخطوة 1 الأهرامات التي يتم إسقاطها على نصفي الكرة الأرضية. توضح الخطوة 2 الأهرامات يتم تسويتها. توضح الخطوة 3 الأهرامات المفلطحة ، بعد أن تم دمجها لتشكيل مستوى ، مع إظهار عدد من خطوط الطول المسقطة. لاحظ أن هذه الخطوط المسقطة مستقيمة وتختلف في الطول ، حسب مكان سقوطها على الأهرامات.

بمجرد إسقاط المساحة على المستوى ، يتحلل المستوى إلى تسلسل هرمي للشبكة من أربعة مستويات. يمكن أن تستخدم المستويات المختلفة كثافات مختلفة للشبكة. يوضح الرسم التوضيحي التالي المستوى بعد تحللها إلى شبكة 4x4 من المستوى 1. لأغراض التوضيح ، تم حذف المستويات الدنيا من التدرج الهرمي للشبكة. في الواقع ، يتحلل المستوى بالكامل إلى تسلسل هرمي للشبكة من أربعة مستويات. بعد انتهاء عملية التحلل ، تتم قراءة البيانات الجغرافية ، صفًا بصف ، من عمود الجغرافيا ، ويتم تنفيذ عملية التغطية بالفسيفساء لكل كائن على حدة.


برنامج نصي SQL

تحقق من أن المثيل الخاص بك يعمل في وضع مصادقة SQL Server و Windows بإصدار الأمر التالي:

يجب أن تتلقى رمز تسجيل الدخول 2.

SQL Server Management Studio (SSMS)

تحقق من تحديد زر الاختيار لـ وضع مصادقة SQL Server و Windows.

إذا كان لديك سا تم تعطيل الحساب ، ثم يرجى المتابعة أيضًا الخطوة 2.. وإلا تكون قد انتهيت.


1 إجابة 1

ذلك لأنني كنت أتصل بـ SQL Server محليًا ، من نفس الخادم الذي استضاف SQL Server. عندما أقوم بالاتصال من جهاز آخر على الشبكة ، فإن آلية المصادقة المستخدمة هي Kerberos ، كما هو متوقع.

سيستخدم SQL Server دائمًا NTLM في حالة الاتصال محليًا. يتم استخدام Kerberos فقط في حالة الاتصال عن بُعد.

هذا المنشور من مدونة SQL Server Protocols ، بينما كان مؤرخًا ، يقول نفس الشيء:

1) يتم استخدام Kerberos عند إجراء اتصال عن بعد عبر TCP / IP في حالة تقديم SPN.

2) يتم استخدام Kerberos عند إجراء اتصال tcp محلي على XP في حالة تقديم SPN.

3) يتم استخدام NTLM عند إجراء اتصال محلي على WIN 2K3.

4) يتم استخدام NTLM عبر اتصال NP.

5) يتم استخدام NTLM عبر اتصال TCP إذا لم يتم العثور على SPN.


هل يمكنني أن أسألك ، كيف يمكن ربط هذين الجدولين معًا وعندما يتم تحديث جدول EMP في قاعدة البيانات ، فهذا يؤدي إلى التحديث إلى الجدول المرتبط من قاعدة البيانات إلى؟

أثناء تصفح المعالج واختيار معالج الاستعلام الجديد ، ينتهي بك الأمر مع بعض SQL ، يجب أن يشير السطر الأول من هذا الرمز إلى قاعدة البيانات من. يجب تغيير هذا إلى قاعدة البيانات وسيتم نسخ الكل.

يجب أن يكون أول سطرين الآن

وكل ما كان في من الآن يتم نسخه إلى!

سبيل المثال أريد نقل حقل
اسم الحقل: الحالة
الحجم: 12
القيمة الافتراضية: NO

أخبار عامة اقتراح سؤال خطأ إجابة نكتة مدح مدير التشدق

استخدم Ctrl + Left / Right للتبديل بين الرسائل ، Ctrl + Up / Down للتبديل بين المواضيع ، Ctrl + Shift + Left / Right للتبديل بين الصفحات.


لم أجرب fn_dblog على Express ولكن إذا كان متاحًا ، فسيمنحك ما يلي عمليات الحذف:

خذ معرّف المعاملة للمعاملات التي تهتم بها وحدد SID الذي بدأ المعاملة باستخدام:

ثم حدد المستخدم من SID:

تحرير: جمع كل ذلك معًا للعثور على المحذوفات في جدول محدد:

إذا كانت قاعدة البيانات في وضع الاسترداد الكامل أو إذا كان لديك نسخ احتياطية لسجل المعاملات ، يمكنك محاولة قراءتها باستخدام قارئات سجلات الجهات الخارجية.

يمكنك تجربة ApexSQL Log (الإصدار المميز ولكن به إصدار تجريبي مجاني) أو SQL Log Rescue (مجاني ولكن SQL 2000 فقط).

كيف يمكنهم معرفة من قام بحذف بعض البيانات في قاعدة بيانات SQL Server الخاصة بهم

على الرغم من الإجابة على هذا السؤال ، أردت أن أضيف أن SQL Server به تتبع افتراضي ممكّن ويمكن استخدامه لمعرفة من قام بإسقاط / تغيير الكائنات.

أحداث الكائن

تتضمن أحداث الكائن: تعديل الكائن وكائن تم إنشاؤه وحذفه

ملاحظة: يحتوي SQL Server افتراضيًا على 5 ملفات تتبع ، كل منها 20 ميغابايت ولا توجد طريقة معتمدة لتغيير ذلك. إذا كان لديك نظام مشغول ، فقد تتدحرج ملفات التتبع بسرعة كبيرة (حتى في غضون ساعات) وقد لا تتمكن من التقاط بعض التغييرات.

يمكنك تجربة هذا الإجراء للاستعلام عن ملفات النسخ الاحتياطي للسجل والعثور على ملف (ملفات) النسخ الاحتياطي للسجل الذي كانت قيمة معينة لعمود من الجدول لا تزال / آخرها موجودة.

للعثور على المستخدم ، بعد أن تجد القيمة التي كانت موجودة مؤخرًا في النسخة الاحتياطية للسجل ، يمكنك استعادة قاعدة بيانات حتى هذا النسخ الاحتياطي للسجل ثم اتباع إجابة Mark Storey-Smith.

بعض المتطلبات

  • تعرف على القيم التي تم حذف الأعمدة منها
  • تخضع لنموذج الاسترداد الكامل وتقوم بعمل نسخ احتياطية للسجلات
  • لديك تواريخ أو معرفات في النسخ الاحتياطية لسجلاتك ، على سبيل المثال عند استخدام حل Ola Hallengren

هذا الحل بعيد عن كونه مقاومًا للماء ، ويحتاج إلى المزيد من العمل.

لم يتم اختباره في بيئات واسعة النطاق ، أو حتى في أي بيئات باستثناء عدد قليل من الاختبارات الصغيرة. تم التشغيل الحالي على SQL Server 2017.

يمكنك استخدام الإجراء أدناه من محمد عمران الذي قمت بتعديله للعمل مع محتويات سجل النسخ الاحتياطية بدلاً من محتويات سجل قاعدة البيانات الحية.

بهذه الطريقة ، لا تقوم بإجراء عمليات الاستعادة من الناحية الفنية ، ولكن بدلاً من ذلك تقوم بتفريغ محتويات السجل في جدول مؤقت. من المحتمل أن تظل بطيئة ، ومنفتحة جدًا على الأخطاء والمشكلات. لكنها يمكن أن تنجح من الناحية النظرية ™.

يستخدم الإجراء المخزن وظيفة fn_dump_dblog غير الموثقة لقراءة ملفات السجل.

بيئة الاختبار

ضع في اعتبارك قاعدة البيانات هذه ، حيث نقوم بإدخال بعض الصفوف ، ونأخذ نسختين احتياطيتين للسجل ، وفي النسخة الاحتياطية الثالثة للسجل ، نحذف جميع الصفوف.

الإجراء

يمكنك العثور على الإجراء المخزن وتنزيله هنا.

لم أتمكن من إضافته هنا لأنه أكبر من عدد الأحرف المسموح به ، وسأجعل هذه الإجابة أقل وضوحًا مما هي عليه.

بصرف النظر عن هذا ، يجب أن تكون قادرًا على تشغيل الإجراء.

تشغيل الإجراء

مثال على ذلك ، عندما أقوم بإضافة جميع ملفات السجل الخاصة بي (4) إلى الإجراء المخزن & amp ، قم بتشغيل الإجراء للبحث عن القيمة 1

حيث يمكننا العثور على آخر مرة حدثت فيها عملية على value1 ، الحذف في log3.trn.

بعض المزيد من بيانات الاختبار ، مع إضافة جدول بأعمدة مختلفة

تغيير أسماء ملفات السجل وأمبير تنفيذ الإجراء مرة أخرى

عملية تشغيل جديدة ، البحث عن العدد الصحيح (2) في عمود val3 من dbo.WrongDeletes2

تطبيق إجابة مارك ستوري سميث

نحن نعلم الآن أنه حدث في ملف السجل الثالث ، فلنستعيد حتى تلك النقطة:


الفشل # 1: افتراض أن SQL Server يخزن قيم التاريخ / الوقت كسلاسل منسقة

غالبًا ما تنتج العديد من حالات الفشل التي تحيط بمعالجة قيم التاريخ / الوقت عن عدم فهم كيفية تخزين SQL Server لهذه القيم. (لا يساعد & # 8217t أن وثائق SQL Server لا تميل إلى التعمق في هذا الموضوع.)

غالبًا ما يفترض مطورو T-SQL المبتدئين أنه يتم تخزين قيم التاريخ / الوقت كمدخلات قابلة للقراءة ، مثل 05-02-2015 10: 05: 23.187. ليست هذه هي القضية. سيكون من الأدق القول إن SQL Server يخزن البيانات كعدد صحيح واحد أو أكثر ، اعتمادًا على نوع البيانات. تشير بعض المصادر إلى أن البيانات مخزنة على شكل عوامات ، لكن المفهوم هو نفسه. نحن نتحدث عن الأرقام المخزنة ، وليس السلاسل المنسقة.

لنبدأ & # 8217s بامتداد التاريخ نوع البيانات. وفقًا لوثائق SQL Server ، يخزن محرك قاعدة البيانات ملف التاريخ القيمة كعددين صحيحين. يمثل العدد الصحيح الأول اليوم ويمثل العدد الصحيح الثاني الوقت. يمكن أن تتراوح الأيام من 1 يناير 1753 وحتى 31 ديسمبر 9999 ، ويمكن أن تتراوح الأوقات من 00: 00: 00.000 إلى 23: 59: 59.997 ، مع القيمة الافتراضية هي 1900-01-01 00: 00: 00.000.

القيمة الافتراضية مهمة بشكل خاص عندما يتعلق الأمر بالتاريخ. 1 يناير 1900 يعتبر اليوم 0. يتم تمثيل التواريخ السابقة بأعداد صحيحة سالبة والتواريخ اللاحقة بأعداد صحيحة موجبة. على سبيل المثال ، 1 يناير 1899 هو اليوم -365 ، والأول من يناير 1901 هو اليوم 365. بالنسبة لجزء الوقت ، يبدأ SQL Server بـ 0 ويزيد القيمة الرقمية لكل 003 ثانية بعد منتصف الليل. هذا يعني أن الوقت 00: 00: 00.003 يتم تخزينه على أنه 1 ، والوقت 00: 00: 01.000 يتم تخزينه على أنه 300.

قد يبدو كل هذا محيرًا في البداية لأنه عند استرداد ملف التاريخ قيمة لأننا نرى شيئًا مختلفًا كثيرًا. على سبيل المثال ، دع & # 8217s تبدأ بملف بسيط التاريخ عامل:

كما توقعنا & # 8217 قد توقعنا أن تحديد تقوم العبارة بإرجاع القيمة بالتنسيق التالي:

للحصول على القيمة الفعلية ، يجب أولاً تحويلها إلى VARBINARY اكتب:

ليس من المستغرب أن تبدو نتائجنا الآن مختلفة تمامًا:

لأن SQL Server يخزن ملف التاريخ القيمة كعددين صحيحين ، حجم التخزين 8 بايت (4 بايت لكل منهما). أول 4 بايت (0000A491) يمثل التاريخ وآخر 4 بايت ( 00A6463C ) تمثل الوقت. بمعرفة هذا ، يمكننا استخدام التضمين وظيفة لإرجاع التاريخ أو الوقت فقط ، كما هو موضح في المثال التالي:

الآن تحديد تقوم العبارة بإرجاع وحدات البايت التي تمثل عددًا صحيحًا للتاريخ:

يمكننا أن نفعل الشيء نفسه بالنسبة لجزء الوقت ، ويمكننا أيضًا تحويل VARBINARY القيم ل ذكاء القيم لمعرفة العدد الفعلي. دع & # 8217s نجمعها معًا للحصول على نظرة عامة حول كيفية عملنا الأصلي التاريخ القيمة مخزنة:

يوضح الجدول التالي النتائج التي تم إرجاعها بواسطة تحديد بيان:

ما تظهره النتائج هو أن 42129 يومًا قد مرت منذ 1 يناير 1900 وأن أكثر من 10 ملايين جزء من الثانية قد انقضت منذ منتصف الليل. الآن دعنا نعيد عقارب الساعة إلى الوراء حوالي 188 سنة:

هذه المرة يأتي العدد الصحيح لليوم عند 26327 يومًا قبل 1 كانون الثاني (يناير) 1900 ، وعدد الساعات الصحيحة للوقت أكثر من 24 مليون تكة:

الآن دع & # 8217s يضبط التاريخ والوقت على الإعداد الافتراضي (اليوم 0):

كما هو متوقع ، فإن VARBINARY و ذكاء قيم كل صفر خارج:

فقط للتأكد من أن كل هذا واضح ، هنا & # 8217s واحدة أخرى التاريخ على سبيل المثال ، يوم واحد وثانية واحدة بعد الافتراضي:

في هذه المرحلة ، يجب أن تكون النتائج متوقعة إلى حد ما. لدينا عدد صحيح للتاريخ 1 وعدد صحيح للوقت 300:

يجب أن يمنحك هذا فكرة جيدة إلى حد ما عن كيفية تخزين محرك قاعدة البيانات التاريخ القيم. ومع ذلك ، فإن SQL Server يتخذ نهجًا مختلفًا إلى حد ما مع أنواع بيانات التاريخ / الوقت الأخرى. & # 8217s نلقي نظرة على ملف التاريخ 2 نوع البيانات ، تم تكوينه بالدقة الافتراضية (7):

هذه المرة تبدو نتائجنا مختلفة قليلاً عن التاريخ القيمة:

بالنسبة إلى التاريخ 2 نوع البيانات ، يستخدم SQL Server البايت الأول لتخزين دقة الوقت ( 07 ) ، آخر ثلاثة بايت لتخزين التاريخ ( EC390B ) وكل شيء بينهما لتخزين الوقت (B4854E9254) ، والتي يمكن أن تختلف في الطول حسب الدقة المحددة. ال تاريخ و الوقت تعمل أنواع البيانات بنفس الطريقة عند تخزين الجزء الخاص بها من القيمة. على سبيل المثال ، إذا حفظنا نفس القيمة في ملف تاريخ عامل:

تتطابق نتائجنا مع نتائج جزء التاريخ الذي تم إرجاعه في المثال السابق:

وهي تعمل بنفس الطريقة مع ملف الوقت نوع البيانات:

تتطابق النتائج مع تلك الخاصة بجزء الوقت الذي تم إرجاعه بواسطة ملف التاريخ 2 مثال:

الآن دع & # 8217s تغير دقة نوع البيانات وقيمة الوقت في ملف التاريخ 2 مثال لتوضيح كيف يمكن أن يتغير جزء الوقت:

ال تحديد يعرض البيان النتائج التالية:

لاحظ أن البايت الأول يعكس الدقة المحددة ( 04 ) وأن هناك عددًا أقل من وحدات البايت المرتبطة بالوقت ( 01000000 ). لسوء الحظ ، فإن المنطق الذي يستخدمه SQL Server لتخزين مكونات التاريخ والوقت التاريخ 2 , تاريخ ، و الوقت ليس مباشرًا كما هو الحال مع التاريخ ، والبحث في هذا المنطق يتجاوز نطاق هذه المقالة ، ولكن يمكنك على الأقل انتقاء البايتات التي تمثل التاريخ والوقت ولديك بعض الإحساس بما يجري.

الهدف من كل هذا ليس حفظ الآليات الدقيقة التي يستخدمها SQL Server لتخزين بيانات التاريخ / الوقت لكل نوع من أنواع البيانات ، ولكن بالأحرى الحصول على إحساس عام بكيفية تخزين البيانات وأنه ليس سلاسل بسيطة تحتوي على تواريخ مكتوبة بالتنسيقات المحددة. يمكن أن يساعدك وجود هذا الأساس في معالجة المشكلات المختلفة التي قد تنشأ عند العمل بقيم التاريخ / الوقت بشكل أفضل.


محتويات

في قلب أي نظام OLAP يوجد مكعب OLAP (يسمى أيضًا "مكعب متعدد الأبعاد" أو مكعب مفرط). يتكون من حقائق رقمية تسمى مقاسات التي تم تصنيفها بواسطة أبعاد. يتم وضع القياسات عند تقاطعات المكعب الفائق ، والذي يمتد حسب الأبعاد كمساحة متجه. الواجهة المعتادة للتعامل مع مكعب OLAP هي واجهة مصفوفة ، مثل الجداول المحورية في برنامج جداول البيانات ، والتي تنفذ عمليات الإسقاط على طول الأبعاد ، مثل التجميع أو المتوسط.

عادةً ما يتم إنشاء البيانات الوصفية للمكعب من مخطط نجمي أو مخطط ندفة ثلجية أو كوكبة حقيقية من الجداول في قاعدة بيانات علائقية. يتم اشتقاق المقاييس من السجلات الموجودة في جدول الحقائق ويتم اشتقاق الأبعاد من جداول الأبعاد.

كل يقيس يمكن اعتبار أنه يحتوي على مجموعة من تسميات، أو البيانات الوصفية المرتبطة به. أ البعد هو ما يصف هذه تسميات يوفر معلومات حول يقيس.

مثال بسيط هو المكعب الذي يحتوي على مبيعات المتجر كملف يقيس، والتاريخ / الوقت كملف البعد. كل عملية بيع لها تاريخ / وقت ضع الكلمة المناسبة التي توضح المزيد عن هذا البيع.

تحرير قواعد البيانات متعددة الأبعاد

يتم تعريف البنية متعددة الأبعاد على أنها "تباين في النموذج العلائقي الذي يستخدم هياكل متعددة الأبعاد لتنظيم البيانات والتعبير عن العلاقات بين البيانات". [6]: 177 الهيكل مقسم إلى مكعبات والمكعبات قادرة على تخزين البيانات والوصول إليها داخل حدود كل مكعب. "تحتوي كل خلية داخل بنية متعددة الأبعاد على بيانات مجمعة تتعلق بالعناصر الموجودة على طول كل من أبعادها". [6]: 178 حتى عند معالجة البيانات ، يظل الوصول إليها سهلاً ويستمر في تكوين تنسيق قاعدة بيانات مضغوطة. لا تزال البيانات مترابطة. تحظى البنية متعددة الأبعاد بشعبية كبيرة لقواعد البيانات التحليلية التي تستخدم تطبيقات المعالجة التحليلية عبر الإنترنت (OLAP). [6] تستخدم قواعد البيانات التحليلية قواعد البيانات هذه نظرًا لقدرتها على تقديم إجابات لاستفسارات الأعمال المعقدة بسرعة. يمكن عرض البيانات من زوايا مختلفة ، مما يعطي منظورًا أوسع لمشكلة ما على عكس النماذج الأخرى. [8]

التجميعات تحرير

لقد تم الادعاء أنه بالنسبة للاستعلامات المعقدة ، يمكن أن تنتج مكعبات OLAP إجابة في حوالي 0.1 ٪ من الوقت المطلوب لنفس الاستعلام على بيانات OLTP العلائقية. [9] [10] أهم آلية في OLAP والتي تسمح لها بتحقيق مثل هذا الأداء هي استخدام التجمعات. يتم إنشاء التجميعات من جدول الحقائق عن طريق تغيير مستوى الدقة في أبعاد معينة وتجميع البيانات على طول هذه الأبعاد ، باستخدام دالة مجمعة (أو دالة التجميع). يتم تحديد عدد التجميعات الممكنة من خلال كل مجموعة ممكنة من تفاصيل الأبعاد.

تحتوي مجموعة جميع التجميعات الممكنة والبيانات الأساسية على إجابات لكل استعلام يمكن الإجابة عليه من البيانات. [11]

نظرًا لوجود العديد من التجميعات التي يمكن حسابها عادةً ، غالبًا ما يتم حساب عدد محدد مسبقًا فقط بشكل كامل ويتم حل الباقي عند الطلب. تُعرف مشكلة تحديد التجميعات (المشاهدات) المراد حسابها بمشكلة اختيار العرض. يمكن تقييد تحديد طريقة العرض بالحجم الإجمالي لمجموعة التجميعات المحددة ، أو الوقت اللازم لتحديثها من التغييرات في البيانات الأساسية ، أو كليهما. الهدف من اختيار العرض هو عادةً تقليل متوسط ​​الوقت للإجابة على استفسارات OLAP ، على الرغم من أن بعض الدراسات تقلل أيضًا من وقت التحديث. عرض التحديد هو NP- مكتمل. تم استكشاف العديد من الأساليب لحل المشكلة ، بما في ذلك الخوارزميات الجشعة ، والبحث العشوائي ، والخوارزميات الجينية وخوارزمية البحث A *.

يمكن حساب بعض وظائف التجميع لمكعب OLAP بأكمله عن طريق الحساب المسبق للقيم لكل خلية ، ثم حساب التجميع لتجميع الخلايا عن طريق تجميع هذه المجاميع ، وتطبيق خوارزمية القسمة والقهر على المشكلة متعددة الأبعاد لحسابها بكفاءة. [12] على سبيل المثال ، فإن المجموع الإجمالي للعرض الإجمالي هو مجرد مجموع المجاميع الفرعية في كل خلية. تسمى الوظائف التي يمكن أن تتحلل بهذه الطريقة وظائف التجميع القابلة للتحلل ، وتشمل COUNT و MAX و MIN و SUM ، والتي يمكن حسابها لكل خلية ثم تجميعها بشكل مباشر تُعرف باسم وظائف التجميع القابلة للتحلل ذاتيًا. [13] في حالات أخرى ، يمكن حساب الدالة التجميعية عن طريق حساب الأرقام المساعدة للخلايا ، وتجميع هذه الأرقام المساعدة ، وأخيراً حساب العدد الإجمالي في النهاية ، تتضمن الأمثلة AVERAGE (تتبع المجموع والعدد ، والقسمة في النهاية) و RANGE ( tracking max and min, subtracting at the end). In other cases the aggregate function cannot be computed without analyzing the entire set at once, though in some cases approximations can be computed examples include DISTINCT COUNT, MEDIAN, and MODE for example, the median of a set is not the median of medians of subsets. These latter are difficult to implement efficiently in OLAP, as they require computing the aggregate function on the base data, either computing them online (slow) or precomputing them for possible rollouts (large space).

OLAP systems have been traditionally categorized using the following taxonomy. [14]

Multidimensional OLAP (MOLAP) Edit

MOLAP (multi-dimensional online analytical processing) is the classic form of OLAP and is sometimes referred to as just OLAP. MOLAP stores this data in an optimized multi-dimensional array storage, rather than in a relational database.

Some MOLAP tools require the pre-computation and storage of derived data, such as consolidations – the operation known as processing. Such MOLAP tools generally utilize a pre-calculated data set referred to as a data cube. The data cube contains all the possible answers to a given range of questions. As a result, they have a very fast response to queries. On the other hand, updating can take a long time depending on the degree of pre-computation. Pre-computation can also lead to what is known as data explosion.

Other MOLAP tools, particularly those that implement the functional database model do not pre-compute derived data but make all calculations on demand other than those that were previously requested and stored in a cache.

  • Fast query performance due to optimized storage, multidimensional indexing and caching.
  • Smaller on-disk size of data compared to data stored in relational database due to compression techniques.
  • Automated computation of higher level aggregates of the data.
  • It is very compact for low dimension data sets.
  • Array models provide natural indexing.
  • Effective data extraction achieved through the pre-structuring of aggregated data.

Disadvantages of MOLAP

  • Within some MOLAP systems the processing step (data load) can be quite lengthy, especially on large data volumes. This is usually remedied by doing only incremental processing, i.e., processing only the data which have changed (usually new data) instead of reprocessing the entire data set.
  • Some MOLAP methodologies introduce data redundancy.

Products Edit

Relational OLAP (ROLAP) Edit

ROLAP works directly with relational databases and does not require pre-computation. The base data and the dimension tables are stored as relational tables and new tables are created to hold the aggregated information. It depends on a specialized schema design. This methodology relies on manipulating the data stored in the relational database to give the appearance of traditional OLAP's slicing and dicing functionality. In essence, each action of slicing and dicing is equivalent to adding a "WHERE" clause in the SQL statement. ROLAP tools do not use pre-calculated data cubes but instead pose the query to the standard relational database and its tables in order to bring back the data required to answer the question. ROLAP tools feature the ability to ask any question because the methodology is not limited to the contents of a cube. ROLAP also has the ability to drill down to the lowest level of detail in the database.

While ROLAP uses a relational database source, generally the database must be carefully designed for ROLAP use. A database which was designed for OLTP will not function well as a ROLAP database. Therefore, ROLAP still involves creating an additional copy of the data. However, since it is a database, a variety of technologies can be used to populate the database.

Advantages of ROLAP Edit

  • ROLAP is considered to be more scalable in handling large data volumes, especially models with dimensions with very high cardinality (i.e., millions of members).
  • With a variety of data loading tools available, and the ability to fine-tune the extract, transform, load (ETL) code to the particular data model, load times are generally much shorter than with the automated MOLAP loads.
  • The data are stored in a standard relational database and can be accessed by any SQL reporting tool (the tool does not have to be an OLAP tool).
  • ROLAP tools are better at handling non-aggregatable facts (e.g., textual descriptions). MOLAP tools tend to suffer from slow performance when querying these elements.
  • By decoupling the data storage from the multi-dimensional model, it is possible to successfully model data that would not otherwise fit into a strict dimensional model.
  • The ROLAP approach can leverage database authorization controls such as row-level security, whereby the query results are filtered depending on preset criteria applied, for example, to a given user or group of users (SQL WHERE clause).

Disadvantages of ROLAP Edit

  • There is a consensus in the industry that ROLAP tools have slower performance than MOLAP tools. However, see the discussion below about ROLAP performance.
  • The loading of aggregate tables must be managed by custom ETL code. The ROLAP tools do not help with this task. This means additional development time and more code to support.
  • When the step of creating aggregate tables is skipped, the query performance then suffers because the larger detailed tables must be queried. This can be partially remedied by adding additional aggregate tables, however it is still not practical to create aggregate tables for all combinations of dimensions/attributes.
  • ROLAP relies on the general purpose database for querying and caching, and therefore several special techniques employed by MOLAP tools are not available (such as special hierarchical indexing). However, modern ROLAP tools take advantage of latest improvements in SQL language such as CUBE and ROLLUP operators, DB2 Cube Views, as well as other SQL OLAP extensions. These SQL improvements can mitigate the benefits of the MOLAP tools.
  • Since ROLAP tools rely on SQL for all of the computations, they are not suitable when the model is heavy on calculations which don't translate well into SQL. Examples of such models include budgeting, allocations, financial reporting and other scenarios.

Performance of ROLAP Edit

In the OLAP industry ROLAP is usually perceived as being able to scale for large data volumes, but suffering from slower query performance as opposed to MOLAP. The OLAP Survey, the largest independent survey across all major OLAP products, being conducted for 6 years (2001 to 2006) have consistently found that companies using ROLAP report slower performance than those using MOLAP even when data volumes were taken into consideration.

However, as with any survey there are a number of subtle issues that must be taken into account when interpreting the results.

  • The survey shows that ROLAP tools have 7 times more users than MOLAP tools within each company. Systems with more users will tend to suffer more performance problems at peak usage times.
  • There is also a question about complexity of the model, measured both in number of dimensions and richness of calculations. The survey does not offer a good way to control for these variations in the data being analyzed.

Downside of flexibility Edit

Some companies select ROLAP because they intend to re-use existing relational database tables—these tables will frequently not be optimally designed for OLAP use. The superior flexibility of ROLAP tools allows this less than optimal design to work, but performance suffers. MOLAP tools in contrast would force the data to be re-loaded into an optimal OLAP design.

Hybrid OLAP (HOLAP) Edit

The undesirable trade-off between additional ETL cost and slow query performance has ensured that most commercial OLAP tools now use a "Hybrid OLAP" (HOLAP) approach, which allows the model designer to decide which portion of the data will be stored in MOLAP and which portion in ROLAP.

There is no clear agreement across the industry as to what constitutes "Hybrid OLAP", except that a database will divide data between relational and specialized storage. [15] For example, for some vendors, a HOLAP database will use relational tables to hold the larger quantities of detailed data, and use specialized storage for at least some aspects of the smaller quantities of more-aggregate or less-detailed data. HOLAP addresses the shortcomings of MOLAP and ROLAP by combining the capabilities of both approaches. HOLAP tools can utilize both pre-calculated cubes and relational data sources.

Vertical partitioning Edit

In this mode HOLAP stores aggregations in MOLAP for fast query performance, and detailed data in ROLAP to optimize time of cube معالجة.

Horizontal partitioning Edit

In this mode HOLAP stores some slice of data, usually the more recent one (i.e. sliced by Time dimension) in MOLAP for fast query performance, and older data in ROLAP. Moreover, we can store some dices in MOLAP and others in ROLAP, leveraging the fact that in a large cuboid, there will be dense and sparse subregions. [16]

Products Edit

The first product to provide HOLAP storage was Holos, but the technology also became available in other commercial products such as Microsoft Analysis Services, Oracle Database OLAP Option, MicroStrategy and SAP AG BI Accelerator. The hybrid OLAP approach combines ROLAP and MOLAP technology, benefiting from the greater scalability of ROLAP and the faster computation of MOLAP. For example, a HOLAP server may store large volumes of detailed data in a relational database, while aggregations are kept in a separate MOLAP store. The Microsoft SQL Server 7.0 OLAP Services supports a hybrid OLAP server

Comparison Edit

Each type has certain benefits, although there is disagreement about the specifics of the benefits between providers.

  • Some MOLAP implementations are prone to database explosion, a phenomenon causing vast amounts of storage space to be used by MOLAP databases when certain common conditions are met: high number of dimensions, pre-calculated results and sparse multidimensional data.
  • MOLAP generally delivers better performance due to specialized indexing and storage optimizations. MOLAP also needs less storage space compared to ROLAP because the specialized storage typically includes compression techniques. [15]
  • ROLAP is generally more scalable. [15] However, large volume pre-processing is difficult to implement efficiently so it is frequently skipped. ROLAP query performance can therefore suffer tremendously.
  • Since ROLAP relies more on the database to perform calculations, it has more limitations in the specialized functions it can use.
  • HOLAP attempts to mix the best of ROLAP and MOLAP. It can generally pre-process swiftly, scale well, and offer good function support.

Other types Edit

The following acronyms are also sometimes used, although they are not as widespread as the ones above:

  • WOLAP – Web-based OLAP
  • DOLAP – Desktop OLAP
  • RTOLAP – Real-Time OLAP
  • GOLAP – Graph OLAP [17][18]
  • CaseOLAP – Context-aware Semantic OLAP, [19] developed for biomedical applications. [20] The CaseOLAP platform includes data preprocessing (e.g., downloading, extraction, and parsing text documents), indexing and searching with Elasticsearch, creating a functional document structure called Text-Cube, [21][22][23][24][25] and quantifying user-defined phrase-category relationships using the core CaseOLAP algorithm.

Unlike relational databases, which had SQL as the standard query language, and widespread APIs such as ODBC, JDBC and OLEDB, there was no such unification in the OLAP world for a long time. The first real standard API was OLE DB for OLAP specification from Microsoft which appeared in 1997 and introduced the MDX query language. Several OLAP vendors – both server and client – adopted it. In 2001 Microsoft and Hyperion announced the XML for Analysis specification, which was endorsed by most of the OLAP vendors. Since this also used MDX as a query language, MDX became the de facto standard. [26] Since September-2011 LINQ can be used to query SSAS OLAP cubes from Microsoft .NET. [27]

History Edit

The first product that performed OLAP queries was تعبير عن، which was released in 1970 (and acquired by Oracle in 1995 from Information Resources). [28] However, the term did not appear until 1993 when it was coined by Edgar F. Codd, who has been described as "the father of the relational database". Codd's paper [1] resulted from a short consulting assignment which Codd undertook for former Arbor Software (later Hyperion Solutions, and in 2007 acquired by Oracle), as a sort of marketing coup. The company had released its own OLAP product, Essbase, a year earlier. As a result, Codd's "twelve laws of online analytical processing" were explicit in their reference to Essbase. There was some ensuing controversy and when Computerworld learned that Codd was paid by Arbor, it retracted the article. OLAP market experienced strong growth in late 1990s with dozens of commercial products going into market. In 1998, Microsoft released its first OLAP Server – Microsoft Analysis Services, which drove wide adoption of OLAP technology and moved it into mainstream.

Product comparison Edit

OLAP clients Edit

OLAP clients include many spreadsheet programs like Excel, web application, SQL, dashboard tools, etc. Many clients support interactive data exploration where users select dimensions and measures of interest. Some dimensions are used as filters (for slicing and dicing the data) while others are selected as the axes of a pivot table or pivot chart. Users can also vary aggregation level (for drilling-down or rolling-up) the displayed view. Clients can also offer a variety of graphical widgets such as sliders, geographic maps, heatmaps and more which can be grouped and coordinated as dashboards. An extensive list of clients appears in the visualization column of the comparison of OLAP servers table.

Market structure Edit

Below is a list of top OLAP vendors in 2006, with figures in millions of US Dollars. [29]


The issue with the Microsoft.VisualStudio.Shell.Interop.8.0 library

So it seemed, the issue had something to do with the Microsoft.VisualStudio.Shell.Interop.8.0.dll file. I searched for this .dll library inside the installed "Microsoft SQL Server Management Studio 18" folder and found two files located at the following path:

  • C:Program Files (x86)Microsoft SQL Server Management Studio 18Common7IDEPublicAssemblies
  • C:Program Files (x86)Microsoft SQL Server Management Studio 18Common7IDEPrivateAssembliesInterop

Both files had the same size of 168KB and both showed the same 8.0.50727.938 version when checked the information under ملكيات:

But, even though, those two files looked identical, by examining the content of the files, it was obvious that they were not the same.

To try to figure out, what was going on, I ran the following command in PowerShell to check for the Assembly version of both library files.

ل .dll file located in the PublicAssemblies folder, the result was:

إصدار اسم
8.0.0.0 Microsoft.VisualStudio.Shell.Interop.8.0

And for a .dll file located in the PrivateAssembliesInterop folder, the result was:

إصدار اسم
15.0.0.0 Microsoft.VisualStudio.Shell.Interop.8.0

From this information, the error message of "The located assembly's manifest definition does not match the assembly reference" made more sense now.


شاهد الفيديو: Using Variables in SQL Queries for Scripts and SQLServer Stored Procedures