این یک مقاله با دسترسی آزاد است که تحت مجوز Creative Commons Attribution توزیع شده است که استفاده، توزیع و تکثیر نامحدود در هر رسانه را مجاز میکند، مشروط بر اینکه اثر اصلی به درستی ذکر شده باشد.
داده های مرتبط
در این مطالعه، دادههای اندازه بلوک بیتکوین، نرخ هش، سختی استخراج، تعداد تراکنشها و ارزش بازار از Data. Bitcoinity. Org، Blockchain. com و CoinMarketCAP هستند. حجم جستجوی Baidu و Google به ترتیب از Baidu Index و Google Trends می آیند. رویدادهای مهم مربوطه از بررسی یازدهمین سالگرد بیت کوین توسط رسانه بلاک چین "Daily Star". قیمت طلا از GOLDHUB می آید. شاخص دلار از Investing. com.
چکیده
بیت کوین به عنوان یک نوع جدید ارز الکترونیکی، بیشتر و بیشتر مورد شناسایی و جستجوی مردم قرار می گیرد، اما نوسان قیمت آن شدیدتر است، بازار ریسک های خاصی دارد و پیش بینی دقیق قیمت آن دشوار است. هدف اصلی این مطالعه استفاده از روش یکپارچه سازی یادگیری عمیق (SDAE-B) برای پیش بینی قیمت بیت کوین است. این روش دو فناوری را ترکیب می کند: یکی یک مدل شبکه عصبی عمیق پیشرفته است که به آن رمزگذاری خودکار حذف نویز انباشته (SDAE) می گویند. روش SDAE برای شبیه سازی رابطه پیچیده غیرخطی بین قیمت بیت کوین و عوامل موثر بر آن استفاده می شود. دیگری یک روش یکپارچه سازی قدرتمند به نام تجمع بوت استرپ (Bagging) است که مجموعه داده های متعددی را برای آموزش مجموعه ای از مدل های پایه (SDAES) تولید می کند. در مطالعه تجربی، این مطالعه توالی قیمت بیت کوین را مقایسه میکند و اندازه بلوک، نرخ هش، سختی استخراج، تعداد تراکنشها، ارزش بازار، حجم جستجوی بایدو و گوگل، قیمت طلا، شاخص دلار و رویدادهای مهم مرتبط را بهعنوان برونزا انتخاب میکند. متغیرها از روش SDAE-B برای مقایسه قیمت بیت کوین برای پیش بینی استفاده می کنند و از روش سنتی یادگیری ماشین LSSVM و BP برای مقایسه قیمت بیت کوین برای پیش بینی استفاده می کنند. نتایج پیشبینی به شرح زیر است: MAPE قیمت پیشبینی SDAE-B 0. 016، RMSE 131. 643 و DA 0. 817 است. در مقایسه با دو روش دیگر، دقت بالاتر و خطای کمتری دارد و به خوبی میتواند ویژگیهای تصادفی و غیرخطی قیمت بیتکوین را ردیابی کند.
1. مقدمه
بیت کوین یک ارز غیرمتمرکز، ناشناس، مالکیت انحصاری و بدون تورم است [1]. فرای و چیا [2] دریافتند که با توجه به ویژگی های نوآورانه عدم تمرکز و قابلیت ردیابی بیت کوین، بیت کوین توجه گسترده ای را از سوی رسانه ها و سرمایه گذاران به خود جلب کرده است. پس از افزایش و کاهش قیمت ارزهای دیجیتال در سال های اخیر، بیت کوین به طور فزاینده ای به عنوان یک دارایی سرمایه گذاری در نظر گرفته می شود. سرمایه گذاران بیت کوین را به عنوان یک سرمایه گذاری سوداگرانه، مشابه سهام اینترنت قرن گذشته می بینند [3]. بیت کوین به عنوان یک ارز رمزنگاری شده، خود برای مدت کوتاهی در مقایسه با ارز دولتی ظاهر می شود [4]. برخلاف ارز دولتی، بیت کوین یک ارز دیجیتال غیرمتمرکز بدون هیچ گونه حمایت اعتباری دولتی است، بنابراین قیمت بیت کوین بسیار نوسان است. نوسانات بسیار بیشتری نسبت به ارزهای دولتی ایجاد می کند. قیمت آن از ارزش صفر زمانی که در سال 2009 تأسیس شد، به حدود 13 دلار در هر بیت کوین در ژانویه 2013 رسید و سپس در دسامبر 2017 به حدود 20000 دلار در هر بیت کوین رسید. ممکن است یک حباب باشد که ثبات سیستم مالی را تهدید می کند. بنابراین باید پیش بینی خوبی از قیمت ارز ویژه داشت. امکان پیش بینی روند قیمت بیت کوین یک مشکل عملی است. نه تنها بر سیاست اقتصادی یک کشور در سطح کلان تأثیر می گذارد، بلکه به شدت بر تصمیم سرمایه گذاران برای خرید و فروش ابزار سرمایه گذاری در سطح خرد تأثیر می گذارد. ماتکوفسکی و جالان [5] دریافتند که پیشبینی دقیق قیمت بیت کوین نه تنها میتواند برای سرمایهگذاران پشتیبانی تصمیمگیری کند، بلکه مرجعی برای دولت برای تدوین سیاستهای نظارتی نیز فراهم میکند.
عواملی که بر قیمت بیت کوین تأثیر می گذارند به همان اندازه قابل توجه هستند. علاوه بر عوامل داخلی مانند اندازه بلوک ، نرخ هش ، مشکل معدن ، حجم معاملات و ارزش بازار بیت کوین ، این مطالعه فکر می کند که عوامل باید جامع تر باشند: اولا ، این مطالعه فکر می کند که شاخص جستجوی Google و Baidu استیک عامل مهم تأثیرگذار بر بیت کوین زیرا این یک شاخص مهم برای اندازه گیری توجه سرمایه گذاران و اعتیاد به رسانه ها است و احساسات بازار رمزنگاری بسیار سوداگرانه را منعکس می کند [6]. ثانیا ، این مطالعه استدلال می کند که عوامل غیر منطقی مانند رویدادهای اصلی و احساسات سرمایه گذار ناشی از سیاست های اقتصادی نیز بر قیمت بیت کوین تأثیر می گذارد [7]. Papadopoulos [8] نشان می دهد که بین قیمت بیت کوین و قیمت طلا تعامل خوبی دارد. Dyhrberg [9] از طریق مدل گارچ ، شباهت بین بیت کوین ، طلا و دلار آمریکا را اثبات کرد. بنابراین ، این مطالعه قیمت طلا و شاخص دلار را به عنوان عوامل مؤثر در قیمت بیت کوین می گیرد. با انتخاب عوامل خارجی فوق ، از مشکل ساده سازی پیش بینی قیمت بیت کوین جلوگیری می شود.
سهم این مطالعه به شرح زیر است: در مقایسه با پیش بینی قیمت دارایی مالی سنتی ، پیش بینی قیمت بیت کوین هنوز در مرحله اولیه است. از آنجا که بیت کوین فاقد فصلی است ، A. Greaves و AU [10] دریافتند که مدل یادگیری ماشین کاربردی و مفید است. به همین ترتیب ، شاه و ژانگ [11] از رگرسیون بیزی برای پیش بینی تغییر قیمت بیت کوین استفاده کردند. در حال حاضر ، الگوریتم های مختلف یادگیری ماشین محبوب مانند SVM [12] ، RNN ، LSTM ، Arima [13] ، GA و NARX [14] نیز برای پیش بینی قیمت بیت کوین اعمال شده اند. اگرچه مدل یادگیری ماشین سنتی مزایای آشکاری در پیش بینی قیمت بیت کوین دارد ، عدم تعادل و یکپارچگی ضعیف داده های مربوطه منجر به مشکلات کم دقت ، استحکام ضعیف و سقوط آسان در بهینه محلی آموزش های عمیق شبکه خواهد شد. با بلوغ فناوری یادگیری ماشین ، یادگیری عمیق به تدریج به جریان اصلی فناوری یادگیری ماشین تبدیل شده است و الگوریتم ها و برنامه های مرتبط با آن نیز شکوفا شده اند. و این توانایی قوی در طبقه بندی ، استخراج ویژگی ها و سایر کارهای مدل سازی غیرخطی را نشان می دهد. یک شبکه خود کدگذاری عمیق یک مدل شبکه به طور گسترده ای در یادگیری عمیق است. با داشتن نمونه داده های کمتری و الگوریتم های طبقه بندی و شناخت مناسب ، می تواند توانایی طبقه بندی بالاتری را بدست آورد و از توانایی و استحکام استخراج ویژگی قوی برخوردار است. پیش بینی بدون نظارت از شبکه های خود کد کننده می تواند به طور موثری ویژگی های داخلی داده های بیت کوین را استخراج کرده و از دست دادن ویژگی های معمولی را تا حد بیشترین کاهش دهد [13 ، 15]. بنابراین ، این مطالعه یک روش گروه یادگیری عمیق (SDAE-B) را برای پیش بینی قیمت بیت کوین ارائه می دهد ، که دو فناوری را ترکیبی می کند: یکی انباشتگی خودروهای دفع کننده (SDAE-B) ، که برای شبیه سازی رابطه پیچیده غیرخطی بین بیت کوین استفاده می شود. قیمت و عوامل تأثیرگذار آن. روش دیگر یک روش ادغام قدرتمند به نام bootstrapping است که چندین مجموعه داده برای آموزش مجموعه ای از مدل های اساسی (SDAES) ایجاد می کند. از طریق استفاده از روش SDAE-B برای مقایسه قیمت ارز ویژه و بدست آوردن نتیجه خوبی.
چارچوب این مطالعه به شرح زیر است: بخش 2 روشهای پیشنهادی را معرفی می کند. بخش 3 تحقیقات تجربی را انجام می دهد و در مورد نتایج بحث می کند. بخش 4 نتیجه گیری را ارائه می دهد و سهم اصلی مطالعه را شرح می دهد.
2. مواد و روشها
2. 1روش ادغام عمیق یادگیری (SDAE-B)
جمع آوری autoencoders denoising (SDAE) [16] یک مدل DNN محبوب است. نتایج نشان می دهد که در یک سری از مشکلات طبقه بندی نسبت به مدل های یادگیری ماشین رقابتی مانند اتوآنمان های انباشته (SAE) و شبکه های اعتقاد عمیق (DBN) از دقت پیش بینی بالاتری برخوردار است. SDAE با انباشت چندین Autoencoders Denoising (DAES) ساخته شده است ، که یک ساختار ویژه شبکه عصبی است. برای نشان دادن SDAE ، Autoencoder (AE) و DAE معرفی می شوند.
2. 1. 1. AutoEncoder (AE)
AutoEncoder (AE) یک شبکه عصبی یک لایه پنهان با اندازه ورودی و خروجی برابر است. در مرحله اول ، یک بردار ورودی x ∈ [0،1] D به یک نمایش پنهان y ∈ [0،1] D ′ توسط یک عملکرد تعیین کننده نقشه برداری می شود:
F ( x ) parametrization is θ =W , b >، W یک ماتریس وزن D ′ × D است ، B یک بردار تعصب است ، وf(·) یک تابع فعال سازی غیرخطی است. سپس ، y در فضای ورودی ، برگه z ∈ [0،1] d را به عنوان معادله زیر نقشه می کند:
With θ ′=W ′, b ′>وادبنابراین ، هر آموزش x (i) به y (i) مربوطه و بازسازی z (i) نقشه برداری می شود. پارامترهای مدل برای به حداقل رساندن میانگین خطای بازسازی بهینه شده اند.
θ ∗ ، θ ′ ∗ = arg θ ، θ ′ min 1 n ∑ i = 1 n l x i ، z i = arg θ ، θ ′ min 1 n ∑ i = 1 n l x i ، g θ f θ x i ،
از کجا L عملکرد ضرر است ، که می تواند خطای مربعی سنتی باشد:
یا چنگال بازسازی:
وینسنت و همکاران.[17] معتقد بود که Autoencoder (AE) یک الگوریتم خود نظارت است ، نه یک الگوریتم بدون نظارت. نیازی به علامت گذاری نمونه های آموزشی نیست و برچسب آن از داده های ورودی تولید می شود. بنابراین ، آموزش یک رمزگذار خاص برای ورودی کلاس مشخص شده و بدون هیچ کار جدید آسان است. AutoEncoder (AE) مربوط به داده است و فقط می تواند داده های مشابه با داده های آموزشی را مقایسه کند. به عنوان مثال ، رمزگذار اتوماتیک که با FACE آموزش دیده است ، در فشرده سازی تصاویر دیگر مانند درختان عملکرد ضعیفی دارد ، زیرا ویژگی هایی که می آموزد مربوط به صورت است.
2. 1. 2. Denoising AutoEncoder (DAE)
بر اساس AutoEncoder (AE) ، AutoEncoders Denoising (DAE) برای جلوگیری از مشکل بیش از حد ، به داده های ورودی لایه ورودی سر و صدای اضافه می کند ، که باعث بهبود استحکام رمزگذار آموخته می شود. ایده اصلی DAE بازسازی ورودی خالص از نسخه فاسد است. اول ، داده های ورودی اصلی خراب X به طور تصادفی X ˜ ∼ Q D X ˜ | نقشه برداری می شوند |x به x. سپس مدل پر سر و صدا X ˜ را وارد کرده و y را با استفاده از y = f θ x ˜ = ϕ w x ˜ + b دریافت کنید. سرانجام ، این جفت نقشه برداری Z = Gθ(y) بازگشت به Z. برای مجموعه آموزش ، بهترین پارامترهای θ و θ ′ با به حداقل رساندن خطای متوسط بازسازی بین z و ورودی بدون آسیب X بدست می آیند. این فرایند در شکل 1 نشان داده شده است.
معماری دائه.
2. 1. 3. انباشت autoencoders denoising (SDAE)
ایده جمع آوری AutoEncoders (SDAE) جمع آوری چندین DAE در کنار هم برای ایجاد یک معماری عمیق است. فقط هنگامی که آموزش کامل شود ، ورودی با سر و صدا اضافه می شود. این به دنبال آموزش حریص لایه به لایه است [18]: هر لایه از لایه خود کدگذاری آموزش بدون نظارت را به طور مستقل انجام می دهد تا خطای بین ورودی را به حداقل برساند (ورودی خروجی لایه پنهان لایه قبلی است) و نتیجه بازسازیوادپس از آموزش لایه k سابق ، می توان لایه K + 1 را آموزش داد ، زیرا خروجی لایه k با انتشار انتشار محاسبه شده است ، و سپس از خروجی لایه k به عنوان ورودی K + 1 برای آموزش استفاده می شود. لایه K + 1.
به طور خاص ، DAE اول از مجموعه آموزش به عنوان ورودی برای آموزش مستقل استفاده می کند و از طریق F یاد می گیردθ(1) عملکرد نقشه برداری. سپس DAE دوم از نمایندگی پنهان y DAE اول به عنوان ورودی برای آموزش و یادگیری توسط f استفاده می کندθ(2) عملکرد نقشه برداری. تمام DAE ها می توانند به طور مستقل طبق همان روال تمرین کنند. یک الگوریتم یادگیری مستقل تحت نظارت (مانند FNN) به ساختار اضافه می شود ، که از نمایش پنهان آخرین DAE به عنوان ورودی استفاده می کند. سرانجام ، SDAE را ایجاد کنید. پس از اتمام آموزش SDAE ، از ویژگی های سطح بالا آن می توان به عنوان ورودی الگوریتم نظارت سنتی استفاده کرد. علاوه بر این ، پارامترهای هر لایه SDAE را می توان همزمان با نزول شیب و سایر الگوریتم های آموزش تنظیم کرد. این فرایند در شکل 2 نشان داده شده است.
معماری SDAE.
2. 1. 4. کیسه
Bagging [19] مخفف bootstrap aggregating است. این یک الگوریتم یادگیری یکپارچه قدرتمند است که می تواند برای کارهایی مانند دو طبقه بندی، چند طبقه بندی و رگرسیون استفاده شود. اصل آن این است که یک مجموعه داده حاوی m نمونه داده شود، ابتدا به صورت تصادفی یک نمونه بردارید و آن را در مجموعه نمونه برداری قرار دهید و سپس نمونه را برگردانید تا نمونه همچنان شانس انتخاب شدن در نمونه گیری بعدی را داشته باشد. بنابراین، پس از M بار نمونهبرداری، میتوانیم یک مجموعه داده با همان مقدار داده m از مجموعه داده اصلی دریافت کنیم. به زبان ساده، در آمار و هر نمونه نمونههای برگشتی وجود دارد. احتمال نمونه برداری یکسان است که یکی از کل نمونه ها می باشد.
تنها زمانی که الگوریتم یادگیری پایه ناپایدار باشد، کیسهسازی میتواند مدلهای پایه متفاوتی تولید کند که میتواند به عنوان روشی برای بهبود دقت پیشبینی با استفاده از این بیثباتی در نظر گرفته شود. مدل شبکه عصبی به دلیل فرآیند اولیه سازی تصادفی وزن ها ناپایدار است، در حالی که شبکه عصبی کیسه ای دارای استحکام قوی است. این با موفقیت در زمینه مالی و اقتصاد اعمال شده است [20-22]. به این دلایل، از bagging می توان برای ایجاد یک ادغام بر اساس SDAES استفاده کرد.
2. 1. 5. پیش بینی چند متغیره
متفاوت از مدل سری زمانی، مدل چند متغیره نه تنها اثر خودرگرسیون سری هدف را در نظر می گیرد، بلکه تأثیر متغیرهای برون زا را بر سری هدف نیز در نظر می گیرد. مدل چند متغیره به عنوان یک روش ساده اما بسیار مهم در فرآیند تحلیل آماری، به طور گسترده در پیش بینی در زمینه های مختلف استفاده شده است. برای مثال، Rombouts و همکاران.[23] آن را در زمینه قیمت گذاری اختیار اعمال کرد. در سالهای اخیر، محققان از مدل چند متغیره و فناوری یادگیری عمیق در زمینه پیشبینی استفاده کردهاند [24]. نتایج نشان می دهد که مدل چند متغیره برای پیش بینی بهتر از مدل تک متغیره عمل می کند. می توان آن را به عنوان تابعی برای شبیه سازی رابطه بین متغیرهای وابسته و متغیرهای مستقل رسمی کرد:
2. 1. 6. فرآیند کلی رویکرد SDAE-B
ایده اصلی مدل هیبریدی به شرح زیر است. مدل یادگیری عمیق SDAE برای استخراج اطلاعات مفید از داده های انتخاب شده و تولید پیش بینی استفاده می شود. روش ادغام قدرتمند بسته بندی برای ترکیب قدرت چند SDAE برای بهبود دقت پیش بینی استفاده می شود تا یک مدل یکپارچه با عملکرد بهتر تولید شود.
SDAE-B قیمت بیت کوین را بر اساس پنج مرحله زیر پیش بینی می کند. شکل 3 نمودار جریان کل فرآیند را نشان می دهد:
مجموعه های آموزشی چندگانه ایجاد کنید: مجموعه های نمونه K از نمونه های آموزش را از طریق الگوریتم bootstrapping تولید کنید.
فرآیند پیش بینی مدل SDAE-B.
3. نتایج و بحث
در این بخش ، توانایی پیش بینی LSSVM و BP را با SDAE-B مقایسه می کنیم. اولا ، توضیحات داده داده می شود. ثانیا ، معیارهای ارزیابی مدل داده می شود. سپس از LSSVM ، BP و SDAE-B برای مقایسه قیمت ارز ویژه برای پیش بینی استفاده می شود. سرانجام ، نتایج مقایسه داده می شود و مورد تجزیه و تحلیل قرار می گیرد.
3. 1مجموعه داده ها
در این مطالعه ، داده های اندازه بلوک بیت کوین ، نرخ هش ، مشکل معدن ، تعداد معاملات و سرمایه گذاری در بازار از Data. bitcoinity. org ، blockchain. com و coinmarketcap است. حجم جستجو بایدو و گوگل به ترتیب از Baidu Index و Google Trends آمده است. رویدادهای مهم مربوطه از بررسی یازدهمین سالگرد بیت کوین توسط رسانه های Blockchain "Daily Star" ناشی می شود. قیمت طلا از Goldhub است. شاخص دلار از Investing. com. داده ها از 29 نوامبر 2014 ، تا 30 مارس 2020 است. این مطالعه نه شاخص بیت کوین ، از جمله اندازه بلوک ، نرخ هش ، مشکل معدن ، حجم معاملات ، ارزش بازار ، BAIDU و حجم جستجوی گوگل ، قیمت طلا ، دلار را انتخاب می کند. شاخص ، رویدادهای مهم مربوطه (جدول 1) به عنوان متغیرهای مستقل ، و قیمت بیت کوین (روند همانطور که در شکل 4 نشان داده شده است) به عنوان متغیرهای وابسته برای ساخت مدل ، همانطور که در جدول 2 نشان داده شده است.