Monday, 1 January 2018

اللوس - مقابل - المتوسط المتحرك


ميك، أولا تثبيت R (إذا لم تكن بالفعل)، تشغيل R وتثبيت حزمة تيتشينغديموس (بالضبط كيف يعتمد على النظام الخاص بك)، وتحميل الحزمة مع مكتبة (تيتشنغديموس) ثم اكتب loess. demo لإظهار صفحة المساعدة لمعرفة كيفية تشغيله، يمكنك التمرير إلى أسفل حيث المثال ونسخ ولصق هذا الرمز إلى سطر الأوامر R39s لرؤية الأمثلة، ثم تشغيل مع البيانات الخاصة بك لمزيد من استكشاف. نداش غريغ سنو مار 23 12 في 17:15 هنا هو استجابة بسيطة ولكنها مفصلة. نموذج خطي يناسب العلاقة من خلال جميع نقاط البيانات. يمكن أن يكون هذا النموذج من الدرجة الأولى (معنى آخر للخطي) أو متعدد الحدود لحساب الانحناء، أو مع الخطوط العريضة لحساب المناطق المختلفة التي لديها نموذج حكم مختلف. تناسب لويس هو الانحدار المرجح المرجح محليا استنادا إلى نقاط البيانات الأصلية. وهذا يعني أن مدخلات لويس تناسب قيمتي X و Y الأصلية، بالإضافة إلى مجموعة من قيم X للإخراج التي تحسب قيم Y الجديدة (عادة ما تستخدم القيم X نفسها لكلا الأمرين، ولكن غالبا ما تستخدم قيم X أقل للأزواج زي المجهزة بسبب زيادة الحساب المطلوب). ولكل قيمة X من الخرج، يستخدم جزء من بيانات الدخل لحساب مدى ملاءمة. الجزء من البيانات، عموما 25 إلى 100 ولكن عادة 33 أو 50، هو محلي، وهذا يعني أن هذا الجزء من البيانات الأصلية الأقرب إلى كل قيمة إخراج X معينة. وهو تناسب متحرك، لأن كل قيمة إخراج X يتطلب مجموعة فرعية مختلفة من البيانات الأصلية، مع أوزان مختلفة (انظر الفقرة التالية). وتستخدم هذه المجموعة الفرعية من نقاط بيانات المدخلات لإجراء انحدار مرجح، حيث تكون النقاط الأقرب إلى قيمة الخرج X تعطي وزنا أكبر. هذا الانحدار هو عادة من الدرجة الثانية من الدرجة الثانية أو أعلى من الممكن، ولكنها تتطلب قوة حسابية أكبر. يتم استخدام قيمة Y لهذا الانحدار المرجح المحسوب عند المخرجات X كقيمة نماذج Y لهذه القيمة X. ويعاد حساب الانحدار عند قيمة كل ناتج X لإنتاج مجموعة كاملة من قيم النواتج Y. أجاب 21 فبراير 15 في 21: 08A متوسط ​​التمهيد بسيط يمكن أن تفسر على أنها الانحدار الخطي المحلي مع نواة مستطيلة. نواة مستطيلة تعين أوزان متساوية (قراءة أهمية) إلى كل نقطة تقع ضمن دعم النواة (قراءة النافذة). إذا كنت تعتقد أن هذا الافتراض يغلف افتراضات النمذجة الخاصة بك بشكل كاف ثم ليس لديك أي سبب لعدم اختيار متوسط ​​متحرك بسيط للتجانس. إذا كنت تعتقد أن هذا الافتراض هو تبسيط مبالغ فيه قليلا. اقرأ وحيدا. دعونا نفترض أن ننظر إلى البيانات (يي، تي) ولكن في الواقع ما يجري هو أن يي ذ (تي) إبسيلوني حيث ذ لديه بعض الشكل الغريب بارامتري و سلس إبسيلون سيم N (0، sigma2). عن طريق تمهيد نحاول تقدير y. يمكن أن نمضي قدما ونناسب نموذجا في جميع البيانات شيء مثل: y beta0 beta1 t إبسيلون (أو درجة أعلى درجة متعددة) ولكننا نعتقد أن هذا هو تقييدية للغاية. لدينا فهم ضمني أن البيانات القريبة من نقطة زمنية t أكثر ارتباطا بقيمة y (t) من البيانات بطريقة أخرى من t. لذلك نقرر بناء نافذة حول t، ويقول t-b، تب حيث b هو عرض النطاق الترددي. الآن، إذا كان الافتراض هو أن جميع النقاط داخل t-b، تب هي نفس القدر من الأهمية لتقدير ذ (ر) ثم نواة مستطيلة حيث يتم ترجيح كل نقطة هي نفسها مثالية بالنسبة لنا. ولكن ربما نفكر. داخل النافذة بعض النقاط المركزية المسألة أكثر ونحن نحاول نواة أخرى) (مثل الثلاثي أو إيبانيشنيكوف) التي تعطى أهمية أكبر للنقاط المركزية. أو في الواقع نحن لسنا متأكدين حقا حول افتراض نافذة لتبدأ لذلك نحن نحاول محاولة نواة (على سبيل المثال غاوسيان) التي لديها دعم لانهائي. (ب يتم تقديرها دائما باستخدام التحقق المتبادل). الانحدار الخطي المحلي يعطي القدرة على اختبار ودمج جميع هذه الافتراضات في الواقع لتقديراتنا النهائية ل y. وأخيرا اسمحوا لي أن أشير إلى أن عدم المرونة تستخدم الانحدار الخطي مرجح محليا لتسهيل البيانات ولكن هم فقط نوع واحد من الطرق متعددة الحدود المحلية (على سبيل المثال، مقدر ناداراياواتسون، واحدة من أقدم مقدر من هذا النوع) المستخدمة في الانحدار شبه المعلمي. نماذج أخرى (على سبيل المثال طرق عقوبة خشونة، مثل تمهيد سبلين) وتتوفر أيضا انظر A. C. دافيسون النماذج الإحصائية. تشققت. 10.7 لمقدمة موجزة لطيفة. أجاب أبريل 3 16 في 3: 01LOESS هي واحدة من العديد من أساليب النمذجة الحديثة التي تبني على الأساليب الكلاسيكية، مثل الخطية وغير الخطية المربعات أقل الانحدار. تم تصميم طرق الانحدار الحديثة لمعالجة الحالات التي لا تؤدي فيها الإجراءات الكلاسيكية أداء جيدا أو لا يمكن تطبيقها بشكل فعال بدون عمل لا مبرر له. لويس يجمع بين الكثير من بساطة الخطي المربعات الصغرى الانحدار مع مرونة الانحدار غير الخطية. وهو يفعل ذلك عن طريق تركيب نماذج بسيطة للمجموعات الفرعية المترجمة من البيانات لبناء وظيفة تصف الجزء الحتمي للتغير في البيانات. نقطة بنقطة. في الواقع، واحدة من أهم عوامل الجذب في هذا الأسلوب هو أن محلل البيانات غير مطلوب لتحديد وظيفة عالمية من أي شكل لتناسب نموذج للبيانات، فقط لتناسب شرائح من البيانات. والمقايضة لهذه الميزات هي زيادة الحساب. ولأنه مكثف من الناحية الحسابية، فقد كان من المستحيل عمليا استخدام لويس في العصر الذي كان يجري فيه تطوير أقل انحدار للمربعات. معظم الأساليب الحديثة الأخرى لنمذجة العملية مماثلة ل لويس في هذا الصدد. وقد صممت هذه الأساليب بوعي لاستخدام قدرتنا الحسابية الحالية لتحقيق أقصى قدر ممكن من المزايا لتحقيق أهداف لا يمكن تحقيقها بسهولة من خلال النهج التقليدية. تعريف لويس نموذج لوس، اقترح أصلا من قبل كليفلاند (1979) ومواصلة تطويرها من قبل كليفلاند وديفلين (1988). يشير بشكل خاص إلى طريقة (إلى حد ما) أكثر وصفا باسم الانحدار متعدد الحدود المرجح محليا. وعند كل نقطة في مجموعة البيانات، تكون الحدود متعددة الحدود ملائمة لمجموعة فرعية من البيانات، مع قيم متغيرة تفسيرية بالقرب من النقطة التي يجري تقدير استجابتها. وتتناسب حدود الحدود باستخدام المربعات الصغرى المرجحة، مما يعطي وزنا أكبر للنقاط القريبة من النقطة التي يتم تقدير استجابتها وخفض الوزن إلى نقاط أبعد من ذلك. وعندئذ يتم الحصول على قيمة دالة الانحدار للنقطة عن طريق تقييم الحدود المتعددة المحلية باستخدام القيم المتغيرة التفسيرية لنقطة البيانات هذه. ويكتمل لويس بعد حساب قيم دالة الانحدار لكل نقطة من نقاط البيانات (n). العديد من تفاصيل هذه الطريقة، مثل درجة نموذج متعدد الحدود والأوزان، مرنة. يتم مناقشة مجموعة الخيارات لكل جزء من الطريقة والقيم الافتراضية الافتراضية لفترة وجيزة بعد ذلك. مجموعات فرعية محلية من البيانات يتم تحديد مجموعات فرعية من البيانات المستخدمة لكل المربعات الصغرى المرجح في لويس من قبل أقرب خوارزمية الجيران. وتحدد المدخلات التي يحددها المستخدم للإجراء المسمى معلمة النطاق الترددي أو التمهيد مقدار البيانات المستخدمة لتتناسب مع كل حدود حدودية محلية. معامل التمهيد (q) هو رقم بين ((d1) n) و (1)، مع (d) يدل على درجة الحدود المحلية. قيمة (q) هي نسبة البيانات المستخدمة في كل مناسبة. وتتألف المجموعة الفرعية من البيانات المستخدمة في كل صالح من المربعات الصغرى المرجحة من النقاط (نك) (مقربة إلى أكبر عدد صحيح) التي تكون قيم المتغيرات التفسيرية فيها أقرب إلى النقطة التي يجري فيها تقدير الاستجابة. (q) معلمة التمهيد لأنها تتحكم في مرونة وظيفة الانحدار لوس. القيم الكبيرة من (q) تنتج أسلس الوظائف التي تذبذب أقل استجابة للتقلبات في البيانات. وكلما كان أصغر (q) كلما اقتربت وظيفة الانحدار من البيانات. استخدام قيمة صغيرة جدا من المعلمة تمهيد غير مرغوب فيه، ولكن، لأن وظيفة الانحدار سوف تبدأ في نهاية المطاف لالتقاط الخطأ العشوائي في البيانات. وتكمن القيم المفيدة لمعلمة التمهيد عادة في المدى من 0.25 إلى 0.5 بالنسبة لمعظم تطبيقات ليس. درجة تعدد الحدود المحلية إن الحدود المتعددة المحلية التي تناسب كل مجموعة فرعية من البيانات تكون دائما تقريبا من الدرجة الأولى أو الثانية، سواء كانت خطية محليا (بمعنى الخط المستقيم) أو من الدرجة الثانية محليا. باستخدام درجة صفرية متعدد الحدود يتحول ليس إلى المتوسط ​​المتحرك المرجح. مثل هذا النموذج المحلي البسيط قد يعمل بشكل جيد لبعض الحالات، ولكن قد لا تقارب دائما الوظيفة الأساسية بشكل جيد. وسوف تعمل حدود متعددة درجة أعلى من الناحية النظرية، ولكن نماذج العائد التي ليست حقا في روح لوس. ويستند لوس على الأفكار أن أي وظيفة يمكن تقريب بشكل جيد في حي صغير من متعدد الحدود ذات الترتيب المنخفض، وأن النماذج البسيطة يمكن أن يصلح للبيانات بسهولة. ومن شأن تعدد الحدود بدرجة عالية أن يميل إلى الإفراط في جمع البيانات في كل مجموعة فرعية وأن تكون غير مستقرة من الناحية العددية، مما يجعل من الصعب حساب حسابات دقيقة. كما ذكر أعلاه، فإن وظيفة الوزن يعطي أكبر وزن لنقاط البيانات الأقرب إلى نقطة التقدير وأقل وزن لنقاط البيانات التي هي أبعد. ويستند استخدام الأوزان إلى فكرة أن النقاط بالقرب من بعضها البعض في الفضاء المتغير التفسري هي أكثر احتمالا أن تكون ذات صلة بعضها البعض بطريقة بسيطة من النقاط التي هي أبعد من ذلك. بعد هذا المنطق، النقاط التي من المرجح أن تتبع النموذج المحلي أفضل تؤثر على تقديرات نموذج المحلية المحلية أكثر من غيرها. النقاط الأقل احتمالا لتتوافق مع النموذج المحلي لها تأثير أقل على تقديرات معلمات النموذج المحلي. دالة الوزن التقليدية المستخدمة ل لويس هي وظيفة الوزن ثلاثي المكعب، w (x) يسار (1 - x3) 3 مبوكس

No comments:

Post a Comment