هدفانجام یک آموزش "تحلیل داده ها و مدل سازی رابطه در بسته R" -کاوش ویژگی های اساسیبرنامه های R - زبان آزادبرنامه نویسی برای محاسبات آماری، و همچنین یادگیری نحوه سازماندهی و مدیریت ورود داده ها، انجام اولیه تحلیل آماریداده ها، آنها را به صورت گرافیکی ارائه دهید، قادر به یافتن روابط در داده ها باشید. این آموزش برای دانش آموزانی طراحی شده است که هیچ تجربه ای در R یا دانش اولیه در مورد بسته ندارند.

داشتن مهارت های برنامه نویسی و آشنایی با مبانی تحلیل آماری برای شنوندگان مطلوب است.

پس از فارغ التحصیلی، می توانید از برنامه R برای موارد زیر استفاده کنید:

  • یک نمونه داده را به درستی برای تجزیه و تحلیل تشکیل دهید
  • سازماندهی ورود داده ها و مدیریت داده ها
  • انجام تجزیه و تحلیل آماری توصیفی
  • روابط را در جداول متقاطع کاوش کنید
  • آزمون فرضیه های آماری در مورد برابری میانگین ها
  • از ویژگی های گرافیکی استفاده کنید
  • انجام تحلیل همبستگی
  • انجام تحلیل رگرسیون
  • انجام تحلیل واریانس

مدت زمان آموزش: 32 هجری قمری یا 4 روز

برنامه آموزشی:

مبحث 1. مفاهیم پایه تجزیه و تحلیل داده های آماری - 2 ac.ch.

  • مطالعه آماری
  • راه های بدست آوردن داده
  • تفاوت بین مشاهده و آزمایش
  • جامعه عمومی و نمونه
  • داده های مورد نیاز برای نمونه گیری
  • مفهوم تخمین آماری نقطه ای و فاصله ای
  • ویژگی ها و متغیرها
  • مقیاس های متغیر
  • تجزیه و تحلیل جهت داده های آماری
  • آمار توصیفی و تحلیلی
  • انتخاب روش های تحلیل آماری بسته به مقیاس های اندازه گیری متغیرها
  • فرضیه آماری
  • انواع خطاهای آماری
  • اصول آزمون فرضیه های آماری
  • انتخاب سطح اهمیت برای آزمون فرضیه

مبحث 2. مقدمه ای بر کار در محیط R - 2 ac.h.

مبحث 3. مبانی برنامه نویسی در R - 2 ac.

  • انواع اشیاء در R
  • بردار
  • لیست ها
  • ماتریس ها
  • عوامل
  • جداول داده
  • اصطلاحات
  • اپراتورهای دسترسی به داده
  • توابع و آرگومان ها
  • چرخه ها و عبارات مشروط
  • مدیریت پایگاه داده در R
  • بردار سازی عملیات
  • اشکال زدایی
  • برنامه نویسی شی گرا

مبحث 4. وارد کردن و سازماندهی داده ها در R - 2 ac.h.

  • راه های دانلود داده ها
  • ورود مستقیم داده ها
  • وارد کردن داده ها در جدول
  • وارد کردن داده ها از MS Excel
  • وارد کردن داده ها از سایر بسته های آماری و پایگاه های داده
  • ذخیره نتایج تجزیه و تحلیل
  • تعیین داده های کمیت
  • تعیین داده های ترتیبی و اسمی
  • تعیین مقادیر از دست رفته در داده ها
  • شناسایی نقاط پرت و خطا
  • اصول تبدیل داده ها

مبحث 5. قابلیت های گرافیکی R - 2 ac.ch.

  • توابع گرافیکی
  • دستگاه های گرافیکی
  • گزینه های گرافیکی
  • گرافیک تعاملی
  • تصاویر ترکیبی
  • دستگاه های خروجی

مبحث 6. تجزیه و تحلیل آماری توصیفی در R – 4 ac.

  • آمار روند مرکزی
  • میانگین حسابی
  • مقدار معین
  • ارزش متوسط
  • آمار پراکندگی
  • واریانس و انحراف معیار
  • ضریب تغییرات
  • صدک ها
  • هیستوگرام ها
  • نمودارهای جعبه
  • تبدیل Z
  • قانون توزیع عادی
  • عدم تقارن و کشیدگی
  • بررسی توزیع برای نرمال بودن
  • برخی از قوانین توزیع
  • توزیع دو جمله ای
  • توزیع پواسون
  • توزیع یکنواخت
  • توزیع نمایی
  • توزیع لگ نرمال
  • خطای استاندارد و فاصله برای میانگین

مبحث 7. تشکیل داده برای تجزیه و تحلیل به روش انتخابی - 2 ac.ch.

  • جامعه عمومی و نمونه
  • ویژگی های نمونه
  • ویژگی های روش نمونه گیری تحقیق
  • طبقه بندی نمونه
  • انواع و روش های انتخاب احتمالی
  • روش های نمونه گیری
  • انتخاب تصادفی ساده
  • انتخاب تصادفی سیستماتیک
  • انتخاب خوشه
  • انتخاب خوشه تک مرحله ای
  • انتخاب خوشه چند مرحله ای
  • الگوریتمی برای انجام نظرسنجی های نمونه
  • تعیین حجم نمونه مورد نیاز

مبحث 8. آزمون های آماری برای تشخیص تفاوت در نمونه ها در R - 4 ac.ch.

  • فرضیه هایی در مورد مقایسه میانگین ها
  • آزمون Z برای مقایسه میانگین ها
  • امتیاز Z برای مقایسه سهام
  • آزمون t تک نمونه ای
  • آزمون تی برای نمونه های مستقل
  • آزمون تی برای نمونه های وابسته
  • شرایط اعمال معیارهای ناپارامتریک
  • یک نمونه تست رتبه امضا شده Wilcoxon
  • تست من ویتنی
  • تست علامت برای نمونه های مرتبط
  • تست علامت ویلکاکسون برای نمونه های مرتبط
  • ANOVA ناپارامتریک کروسکال-والیس
  • معیار فریدمن برای نمونه های وابسته

مبحث 9. ارزیابی رابطه بین متغیرها در R - 4 ac.ch.

  • تجزیه و تحلیل رابطه بین متغیرهای طبقه بندی شده
  • جداول احتمالی
  • فرکانس های مورد انتظار و باقیمانده ها در جداول احتمالی
  • آزمون Chi-Square
  • معیارهای خوبی
  • طبقه بندی انواع رابطه بین متغیرهای کمی
  • نمودارهای پراکنده
  • پیش نیازها و شرایط تجزیه و تحلیل همبستگی
  • ضریب همبستگی پیرسون
  • ضرایب همبستگی رتبه
  • ضریب همبستگی اسپیرمن
  • بررسی اهمیت یک رابطه
  • برآوردهای فاصله ای ضرایب همبستگی
  • ضرایب همبستگی جزئی

مبحث 10. مدلسازی شکل ارتباط با استفاده از تحلیل رگرسیون در R-4 ac.ch.

  • مفاهیم اساسی تحلیل رگرسیون
  • مدل رگرسیون خطی زوج و چندگانه
  • پیشینه تحلیل رگرسیون خطی
  • برآورد ضرایب رگرسیون
  • بررسی اعتبار مدل رگرسیون
  • اهمیت معادله رگرسیون
  • اهمیت ضرایب رگرسیون
  • انتخاب متغیرها در تحلیل رگرسیون
  • تخمین دقت معادله رگرسیون
  • برآورد پایداری آماری معادله رگرسیون
  • تخمین نقطه ای و بازه ای متغیر وابسته
  • مدل های رگرسیون غیرخطی
  • متغیرهای توضیحی طبقه بندی در مدل رگرسیونی

مبحث 11. مدلسازی رابطه با استفاده از تحلیل واریانس در R-4 ac.ch.

  • مدل های ANOVA
  • پیش نیازهای استفاده از تحلیل واریانس
  • آزمون فرضیه برابری واریانس ها
  • مدل ANOVA یک طرفه
  • جدول ANOVA یک طرفه
  • ارزیابی میزان تأثیر عامل
  • آزمون‌های تعقیبی برای مقایسه‌های زوجی
  • تجزیه و تحلیل واریانس با دو یا چند عامل
  • جدول ANOVA دو طرفه با تعامل
  • تفسیر گرافیکی از تعامل عوامل
  • تجزیه و تحلیل یک مدل چند متغیره

تجزیه و تحلیل داده ها در محیط R

مؤسسه ریاضیات محاسباتی و فناوری اطلاعات، گروه تجزیه و تحلیل داده ها و تحقیقات عملیات


جهت
: 01.03.02 «ریاضی کاربردی و انفورماتیک. برنامه نویسی سیستم"(لیسانس سال سوم)

انضباط: "تحلیل داده ها در محیط R"

سرفصل دروس: "آموزش تمام وقت، 2017"

تعداد ساعت: 90 (شامل: سخنرانی - 18، کلاسهای آزمایشگاهی - 36، کار مستقل - 36)؛ شکل کنترل - افست.

جهت: 38.03.05 "انفورماتیک بازرگانی" (کارشناسی سال چهارم)

انضباط: "تحلیل داده ها"

سرفصل دروس: "آموزش تمام وقت، 2018"

تعداد ساعت: 78 (شامل: سخنرانی - 18، کلاسهای آزمایشگاهی - 36، کار مستقل - 24)؛ شکل کنترل - افست.


کلید واژه ها
: داده کاوی، یادگیری ماشین، رگرسیون، طبقه بندی، خوشه بندی، بردار پشتیبانی، SVM، نوترون مصنوعی، شبکه عصبی، سیستم توصیه، تجزیه و تحلیل داده، یادگیری ماشین، مدل، نمونه، متغیر پاسخ، یادگیری نمونه، برازش نمونه، یادگیری تحت نظارت، آموزش بدون نظارت ، بسته R، زبان برنامه نویسی R، آمار، متغیر تصادفی، r.v.، قانون توزیع، توزیع نرمال، نمونه گیری، آمار، روش حداکثر درستنمایی، توزیع کای دو، توزیع دانشجویی، توزیع فیشر، فرضیه، حوزه پذیرش فرضیه، سطح معناداری، نوع خطاهای نوع اول و دوم، مقایسه نمونه، خوبی برازش، جدول اقتضایی، همبستگی، رگرسیون، رگرسیون خطی، رگرسیون غیر خطی، عامل، پیش بینی کننده، رگرسیون یک طرفه، رگرسیون چندگانه، طبقه بندی، رگرسیون لجستیک، تحلیل تفکیک کننده یک طرفه رویکرد بیزی، بیز ساده لوح، ماشین بردار پشتیبان، ابرصفحه جداکننده، درخت تصمیم، شبکه عصبی، نورون، تابع فعال‌سازی، سیستم توصیه‌گر، خوشه‌بندی، عملکرد کیفیت.

تم ها: 1. محیط توسعه R: اطلاعات از تاریخ. نصب و اجرای پکیج 2. برنامه نویسی در R. مراحل اول. 3. ترسیم نمودار در محیط R 4. ورود داده ها و کار با فایل ها در محیط R 4.1. کار با آرایه های داده یک بعدی 4.2. کار با ماتریس ها و جداول داده 5. آزمون فرضیه های آماری در محیط R. 5.1. آزمون فرضیه قانون توزیع احتمال یک متغیر تصادفی (آزمون کای اسکوئر پیرسون). 5.2. آزمون فرضیه استقلال ویژگی ها با گروه بندی کیفی (آزمون کای اسکوئر پیرسون). 5.3. آزمون فرضیه برابری انتظارات ریاضی جمعیت های عادی عادی (معیار دانشجو). 5.4. آزمون فرضیه برابری واریانس جمعیت های عادی عادی (معیار فیشر). 6. مسئله ساخت مدل رگرسیون خطی تک عاملی. پیش بینی. 7. مسئله رگرسیون خطی چندگانه. 7.1. مسئله رگرسیون خطی تک عاملی به عنوان یک مورد خاص از رگرسیون چندگانه. 7.2. بررسی وابستگی متغیر پاسخ به عامل در مدل رگرسیون. 8. وظیفه طبقه بندی، رویکردهای حل آن. 8.1. رگرسیون لجستیک 8.2. تجزیه و تحلیل تفکیک خطی. 8.3. درختان تصمیم - اصل "تقسیم و غلبه" ("تقسیم کن و غلبه کن"). 9. شبکه های عصبی(شبکه های عصبی) و کاربرد آنها در یادگیری ماشین. 10. بردارهای پشتیبانی، ماشین های بردار پشتیبان ("ماشین های بردار پشتیبان"، SVM) در یادگیری ماشین. 11. سیستم های توصیه کننده ("سیستم توصیه")، هدف، ساخت، کاربرد آنها. 12. وظایف ویژه یادگیری ماشین.


تاریخ شروع عملیات: 1 سپتامبر 2014
  • میساروف موکاداس دمختاسیبوویچ گروه تجزیه و تحلیل داده ها و تحقیقات عملیات KFU، دکترای علوم فیزیک و ریاضی، استاد، ایمیل: [ایمیل محافظت شده]
  • Kashina Olga Andreevna، کاندیدای علوم فیزیکی و ریاضی، دانشیار گروه تجزیه و تحلیل داده ها و تحقیقات عملیات، ایمیل: [ایمیل محافظت شده]

معرفی

اول از همه، بیایید اصطلاحات را مورد بحث قرار دهیم. ما در مورد حوزه ای صحبت می کنیم که در ادبیات غربی داده کاوی نامیده می شود و اغلب به روسی به عنوان "تحلیل داده" ترجمه می شود. این اصطلاح کاملاً موفق نیست، زیرا کلمه "تحلیل" در ریاضیات کاملاً آشنا است، معنای ثابتی دارد و در نام بسیاری از بخش های کلاسیک گنجانده شده است: تجزیه و تحلیل ریاضی، تجزیه و تحلیل تابعی، تجزیه و تحلیل محدب، تجزیه و تحلیل غیر استاندارد، پیچیده چند متغیره. تجزیه و تحلیل، تجزیه و تحلیل گسسته، تجزیه و تحلیل تصادفی، تجزیه و تحلیل کوانتومی و غیره. در تمام این حوزه های علم، یک دستگاه ریاضی مورد مطالعه قرار می گیرد که بر اساس برخی نتایج اساسی است و امکان حل مسائل از این حوزه ها را فراهم می کند. در تجزیه و تحلیل داده ها، وضعیت بسیار پیچیده تر است. این، اول از همه، علم کاربردی است که در آن هیچ دستگاه ریاضی وجود ندارد، به این معنا که مجموعه محدودی از حقایق اساسی وجود ندارد که از آن چگونگی حل مسائل پیروی کند. بسیاری از مسائل "انفرادی" هستند و اکنون کلاس های جدیدی از مسائل ظاهر می شوند که برای آنها لازم است یک دستگاه ریاضی ایجاد شود. در اینجا نقش مهمتری با این واقعیت ایفا می کند که تجزیه و تحلیل داده ها یک جهت نسبتاً جدید در علم است.

در مرحله بعد، لازم است توضیح داده شود که "تحلیل داده ها" چیست. من اسمش را گذاشتم "منطقه"، اما منطقه چیست؟ اینجاست که سرگرمی شروع می شود، زیرا این تنها یک رشته علمی نیست. یک تحلیلگر واقعی، اول از همه، مسائل کاربردی را حل می کند و هدف آن تمرین است. علاوه بر این، تجزیه و تحلیل داده ها در اقتصاد، زیست شناسی، جامعه شناسی، روانشناسی و غیره ضروری است. راه حل

کارهای جدید همانطور که گفتم مستلزم ابداع تکنیک های جدید است (اینها همیشه تئوری نیستند، بلکه تکنیک ها، روش ها و غیره هستند) بنابراین برخی می گویند تجزیه و تحلیل داده ها نیز یک هنر و صنعت است.

که در زمینه های کاربردی، مهمترین چیز تمرین است! غیرممکن است جراحی را تصور کنید که حتی یک عمل جراحی انجام نداده باشد. در واقع، این اصلا یک جراح نیست. همچنین، یک تحلیلگر داده نمی تواند بدون حل مسائل کاربردی واقعی کار کند. هر چه بیشتر این کارها را به تنهایی حل کنید، متخصصان واجد شرایط تری خواهید بود.

اول، تجزیه و تحلیل داده ها تمرین، تمرین و تمرین بیشتر است. حل مشکلات واقعی، بسیاری از مناطق مختلف، ضروری است. از آنجایی که، برای مثال، طبقه بندی سیگنال ها و متون دو حوزه کاملا متفاوت هستند. کارشناسانی که به راحتی می توانند یک الگوریتم تشخیص موتور را بر اساس سیگنال های حسگر بسازند، ممکن است نتوانند یک فیلتر هرزنامه ایمیل ساده بسازند. اما کسب مهارت های اولیه هنگام کار با اشیاء مختلف بسیار مطلوب است: سیگنال ها، متون، تصاویر، نمودارها، توضیحات ویژگی ها و غیره. علاوه بر این، به شما این امکان را می دهد که وظایف را مطابق میل خود انتخاب کنید.

ثانیاً، انتخاب دوره های آموزشی و مربیان مناسب مهم است.

که در اصولاً شما می توانید همه چیز را خودتان یاد بگیرید. به هر حال، ما با حوزه ای که در آن وجود دارد، کار نداریمبرخی از رازها دهان به دهان منتقل می شود. در مقابل، بسیاری از دوره های آموزشی شایسته، کدهای منبع برنامه ها و داده ها وجود دارد. علاوه بر این، زمانی که چندین نفر یک مشکل را به طور موازی حل کنند بسیار مفید است. واقعیت این است که هنگام حل چنین مشکلاتی باید با برنامه نویسی بسیار خاصی سر و کار داشت. بیایید الگوریتم شما را بگوییم

89% پاسخ صحیح داده است. سوال: زیاد است یا کم؟ اگر کافی نیست، پس مشکل چیست: آیا الگوریتم را اشتباه برنامه ریزی کرده اید، پارامترهای الگوریتم را اشتباه انتخاب کرده اید یا خود الگوریتم بد است و برای حل این مشکل مناسب نیست؟ اگر کار تکراری باشد، می توان به سرعت خطاهای برنامه و پارامترهای نادرست را پیدا کرد. و اگر توسط متخصص تکرار شود، مسائل ارزیابی نتیجه و مقبولیت مدل نیز به سرعت حل می شود.

ثالثاً، یادآوری این نکته مفید است که حل مشکل تجزیه و تحلیل داده ها زمان زیادی می برد.

آمار

تجزیه و تحلیل داده ها در R

1. متغیرها

که در R نیز مانند سایر زبان های برنامه نویسی دارای متغیرهایی است. متغیر چیست؟ در واقع این آدرسی است که با آن می توانیم پیدا کنیمبرخی از داده هایی که در حافظه ذخیره می کنیم.

متغیرها از قسمت های چپ و راست تشکیل شده اند که توسط عملگر انتساب از هم جدا شده اند. در R، عملگر انتساب "<-”, если название переменной находится слева, а значение, которое сохраняется в памяти - справа, и она аналогична “=” в других языках программирования. В отличии от других языков программирования, хранимое значение может находиться слева от оператора присваивания, а имя переменной - справа. В таком случае, как можно догадаться, оператор присваивания примет конструкцию следующего вида: “->”.

که در بسته به داده های ذخیره شده، متغیرها می توانند باشند انواع مختلف: عدد صحیح، واقعی، رشته. مثلا:

my.var1<- 42 my.var2 <- 35.25

در این حالت متغیر my.var1 از نوع صحیح و my.var2 از نوع واقعی خواهد بود.

درست مانند سایر زبان های برنامه نویسی، می توانید عملیات حسابی مختلفی را با متغیرها انجام دهید.

my.var1 + my.var2 - 12

my.var3<- my.var1^2 + my.var2^2

علاوه بر عملیات حسابی می توانید عملیات منطقی یعنی عملیات مقایسه انجام دهید.

my.var3 > 200 my.var3 > 3009 my.var1 == my.var2 my.var1 != my.var2 my.var3 >= 200 my.var3<= 200

نتیجه عملیات منطقی عبارت درست (TRUE) یا نادرست (FALSE) خواهد بود. شما همچنین می توانید عملیات منطقی را نه تنها بین یک متغیر با مقداری، بلکه با متغیر دیگری نیز انجام دهید.

my.new.var<- my.var1 == my.var2

Random Forest یکی از الگوریتم های داده کاوی مورد علاقه من است. اولاً، فوق العاده همه کاره است، می توان از آن برای حل مشکلات رگرسیون و طبقه بندی استفاده کرد. جستجو برای ناهنجاری ها و انتخاب پیش بینی کننده ها. ثانیاً، این یک الگوریتم است که اعمال نادرست آن واقعاً دشوار است. صرفاً به این دلیل که برخلاف سایر الگوریتم‌ها، پارامترهای قابل تنظیم کمی دارد. و با این حال در ذات خود به طرز شگفت آوری ساده است. در عین حال، دقت قابل توجهی دارد.

ایده چنین الگوریتم شگفت انگیزی چیست؟ ایده ساده است: فرض کنید الگوریتم بسیار ضعیفی داریم. اگر با استفاده از این الگوریتم ضعیف تعداد زیادی مدل مختلف بسازیم و نتیجه پیش‌بینی‌های آنها را میانگین‌گیری کنیم، نتیجه نهایی بسیار بهتر خواهد بود. این به اصطلاح یادگیری گروهی در عمل است. بنابراین الگوریتم جنگل تصادفی "جنگل تصادفی" نامیده می شود، برای داده های دریافتی، درخت های تصمیم گیری زیادی ایجاد می کند و سپس نتیجه پیش بینی های آنها را میانگین می کند. نکته مهم در اینجا عنصر تصادفی بودن در ایجاد هر درخت است. به هر حال، واضح است که اگر تعداد زیادی درخت یکسان ایجاد کنیم، نتیجه میانگین گیری آنها دقت یک درخت را خواهد داشت.

او چگونه کار می کند؟ فرض کنید مقداری داده ورودی داریم. هر ستون مربوط به برخی از پارامترها، هر ردیف مربوط به برخی از عناصر داده است.

می‌توانیم به‌طور تصادفی تعدادی ستون و ردیف از کل مجموعه داده انتخاب کنیم و از آنها یک درخت تصمیم بسازیم.


پنجشنبه 10 می 2012

پنجشنبه 12 ژانویه 2012


این در واقع تمام است. پرواز 17 ساعته تمام شده است، روسیه در خارج از کشور باقی مانده است. و از پنجره یک آپارتمان دنج 2 خوابه، سانفرانسیسکو، دره معروف سیلیکون، کالیفرنیا، ایالات متحده آمریکا به ما نگاه می کند. بله، به همین دلیل است که اخیراً زیاد ننوشتم. ما حرکت کردیم.

همه چیز در آوریل 2011 زمانی که من یک مصاحبه تلفنی با Zynga داشتم شروع شد. سپس همه چیز شبیه نوعی بازی به نظر می رسید که هیچ ربطی به واقعیت نداشت و من حتی نمی توانستم تصور کنم که به چه چیزی منجر می شود. در ژوئن 2011، زینگا وارد مسکو شد و یک سری مصاحبه انجام داد، حدود 60 کاندیدایی که مصاحبه تلفنی را پشت سر گذاشتند در نظر گرفته شدند و حدود 15 نفر از بین آنها انتخاب شدند (تعداد دقیق را نمی دانم، بعداً یک نفر نظر خود را تغییر داد. کسی بلافاصله امتناع کرد). مصاحبه به طرز شگفت آوری ساده بود. هیچ کار برنامه نویسی برای شما، هیچ سؤال پیچیده ای در مورد شکل دریچه ها، عمدتاً توانایی چت آزمایش شد. و دانش، به نظر من، فقط سطحی ارزیابی شد.

و سپس دزدی شروع شد. ابتدا منتظر نتایج، سپس پیشنهاد، سپس تایید LCA، سپس تایید دادخواست برای ویزا، سپس مدارک از ایالات متحده، سپس خط سفارت، سپس بررسی اضافی، سپس ویزا گاهی به نظرم رسید که حاضرم همه چیز را رها کنم و گل بزنم. گاهی شک داشتم که آیا ما به این آمریکا نیاز داریم، زیرا روسیه هم بد نیست. کل فرآیند حدود نیم سال طول کشید، در نهایت در اواسط دسامبر، ویزا دریافت کردیم و شروع به آماده سازی برای خروج کردیم.

دوشنبه اولین روز من در کار جدید بود. این دفتر همه شرایط را دارد که نه تنها برای کار، بلکه برای زندگی نیز وجود دارد. صبحانه، ناهار و شام از سرآشپزهای خودمان، انبوهی از غذاهای متنوع در گوشه و کنار، سالن بدنسازی، ماساژ و حتی آرایشگاه. همه اینها برای کارمندان کاملا رایگان است. بسیاری از آنها با دوچرخه سر کار می آیند و چندین اتاق برای نگهداری وسایل نقلیه مجهز شده است. به طور کلی، من هرگز چنین چیزی را در روسیه ندیده ام. با این حال، هر چیزی قیمت خود را دارد، بلافاصله به ما هشدار داده شد که کار زیادی می خواهد. آنچه که "خیلی" است، با معیارهای آنها، برای من خیلی روشن نیست.

با این حال، امیدوارم با وجود حجم زیاد کار، در آینده ای قابل پیش بینی بتوانم وبلاگ نویسی را از سر بگیرم و شاید چیزی در مورد زندگی آمریکایی و کار به عنوان برنامه نویس در آمریکا بگویم. صبر کن و ببین. در ضمن، کریسمس و سال نو را به همه شما تبریک می گویم و به زودی شما را می بینم!


برای مثالی از استفاده، بیایید بازده سود سهام شرکت های روسی را چاپ کنیم. به عنوان قیمت پایه، قیمت پایانی سهم را در روز بسته شدن ثبت در نظر می گیریم. به دلایلی، این اطلاعات در وب سایت Troika در دسترس نیست و بسیار جالب تر از مقادیر مطلق سود سهام است.
توجه! اجرای کد زمان زیادی می برد، زیرا برای هر سهم، باید از سرورهای فینام درخواست بدهید و ارزش آن را دریافت کنید.

نتیجه<- NULL for(i in (1:length(divs[,1]))){ d <- divs if (d$Divs>0) (امتحان (( نقل قول<- getSymbols(d$Symbol, src="Finam", from="2010-01-01", auto.assign=FALSE) if (!is.nan(quotes)){ price <- Cl(quotes) if (length(price)>0) (dd<- d$Divs result <- rbind(result, data.frame(d$Symbol, d$Name, d$RegistryDate, as.numeric(dd)/as.numeric(price), stringsAsFactors=FALSE)) } } }, silent=TRUE) } } colnames(result) <- c("Symbol", "Name", "RegistryDate", "Divs") result


به طور مشابه، می توانید آمار سال های گذشته را بسازید.