Існує мій проект, який вимагає, щоб з Інтернету було завантажено близько 1,2 ТБ даних та запущено сценарії, щоб перетворити його на якийсь інший кінцевий результат. Отже, я бачу тут три проблеми:
- Завантаження: я не можу завантажити цю кількість даних зі свого ноутбука через низьку швидкість завантаження.
- Зберігання: завантажені файли повинні зберігатися десь. Знову мій ноутбук не має достатньої кількості пам'яті для цього (зважаючи на те, що він може мати можливість завантажувати файли чарівно)
- Обробка: Після завантаження та зберігання мені потрібно запустити сценарії над файлами, щоб отримати кінцевий результат. Враховуючи величезний розмір входу, це не може зробити мій ноутбук за певний час.
Тому я бачу лише AWS як варіант. Я роздивився деякі пропоновані ними продукти, і з поверхні здається, що обробну частину можна зробити продуктом під назвою EC2 (Еластичні хмарні обчислення), а зберігання може бути виконано продуктом під назвою S3 , масштабований зберігання.
Я не зміг знайти нічого, що відповідало б моїм вимогам до завантаження .
Отже, чи можу я використати вищезазначене рішення для завантаження даних?