Чи можна послабити стандарти надійності для оптичних модулів/пристроїв центру обробки даних?
Dec 11, 2025|
◆Вимоги до енергоспоживання оптичного модуля ЦОД
Відмінності в робочому середовищі оптичних модулів у телекомунікаційних і дата-центрах
Є три основні відмінності:
Різні робочі температури
Телекомунікаційні програми відчувають добові коливання температури через добову різницю температур, а також сезонні коливання температури через зміну пір року. Оптичні модулі повинні адаптуватися до цих варіацій. Програми телекомунікаційного-класу поділяються на внутрішні та зовнішні середовища. Внутрішнє середовище становить 0~70 градусів, широко відоме як комерційний клас; зовнішньому середовищі, як правило, вимагає -40 ~ 85 градусів, широко відомий як промисловий клас.
Центри обробки даних бувають різними; їхоптичні модуліпотрібно лише пройти температурний цикл 10 градусів, який є надзвичайно стабільним.
Чи можемо ми знизити вимоги до тестування надійності за високої-температури та високої{1}}вологості, яке ми вимагаємо щодня в центрах обробки даних?
Різні життєві цикли продукту
Очікується, що програми телекомунікаційного{0}}класу після розгортання прослужать десятиліттями; типові життєві цикли надійності розроблені та оцінені на основі 20 років.
Програми центрів обробки даних зазвичай замінюють кожні два-три роки.
Гаразд, я роблю те, що не ламається 50 років, але ти використовуєш це два роки, а потім викидаєш? Чи можемо ми трохи знизити вимоги до терміну служби?

Різні конструкції резервування
Телекомунікаційні додатки мають схеми резервування лінії, але резервування невелике. На критичних лініях використовується резервна комутація зв'язку. Однак ми часто чуємо новини про те, що десятки тисяч користувачів постраждали від збою одного основного пристрою, що впливає на їхні телефонні дзвінки та доступ до Інтернету. Одним словом, нездатність оптичних модулів функціонувати є критичною проблемою. Центри обробки даних мають набагато більше резервування, особливо тому, що понад 90% серверів є хмарними. Тому користувачі майже не знають про поломку оптичного модуля. Для постачальників, навіть якщо деякі оптичні модулі випадково виходять з ладу, їх можна просто замінити.
Отже, чи можна послабити вимоги до надійності оптичних модулів? З точки зору застосування, зниження вимог до надійності мало впливає на клієнтів. Наступне питання: що потрібно розслабити? Як його слід розслабити? А чому це має бути розслабленим?
Основні несправні компоненти та причини несправностей оптичних модулів

Facebook оприлюднив статистику збоїв для aОптичний модуль 100G, показуючи, що 97% несправностей були-пов’язані з лазером, причому більшість з них траплялися протягом трьох місяців після початкової роботи лазера. Якщо більшість відмов відбувається протягом трьох місяців, чи слід скоригувати визначення ранньої відмови? Серед лазерів, що вийшли з ладу, частота відмов DFB (цифрових лампочок) значно вища, ніж у EML (електромагнітних ламінатів) (у кілька сотень разів більше). У зв’язку з цим виникає питання про те, чи вважає доктор Зенг із Facebook, що DFB у режимі прямої модуляції більш схильні до виходу з ладу, ніж DFB, які випромінюють світло безперервно (подібно до того, як нерухомий дріт може прослужити довго, але повторне згинання легко порве його).
Отже, для лазерів, які є основними об’єктами відмови, чи слід збільшити перевірку надійності на рівні лазерної пластини? Якщо це пов’язано з режимом модуляції, довго{0}}тестування тривалості роботи має включати перевірку в режимі модуляції?
Послабте вимоги до надійності
Зокрема, якщо вимоги до надійності потрібно пом’якшити, чи слід зменшити кількість тестових елементів, знизити умови тестування, скоротити час тестування чи зменшити кількість тестових зразків?
Зменшити кількість тестових завдань?
Насправді тестів на надійність небагато. Навіть якщо один або два вилучені, вони не підлягають тестуванню на високу температуру та високу вологість, про що піклуються виробники оптичних модулів. Швидше, це якісь менш важливі речі. Зменшення кількості тестових завдань має сенс, але не дуже суттєво.
Зменшити умови тестування?
Це можливо, але для того, щоб зменшити, потрібен аналіз даних, щоб знайти відповідні умови тестування.

Стиснути час тестування?
Як щодо 500 годин, не 5000 годин, не 2000 годин, не 1000 годин, а лише 500 годин? Таким чином, перевірка надійності не призведе до тривалого циклу запуску продукту.
Intel дав цікаву відповідь: виходячи з коефіцієнта прискорення GR468, 10-річний термін служби можна перевірити за 6 тижнів, використовуючи коефіцієнт прискорення 100x.
Тоді, якщо ми підвищимо температуру перевірки надійності до 130 градусів, коефіцієнт прискорення стане 1000x, і 17-річний термін служби можна перевірити за один тиждень.
Здається, це ще більше стискає час, чи не так?
Чи можемо ми скоротити тривалість тестування, збільшивши розмір зразка, наприклад, 500 зразків для 500 годин високої температури та вологості?
Зменшити розмір вибірки для перевірки надійності?
Broadcom має статистичний аналіз відхилень у прогнозі тривалості життя, спричинених різними розмірами вибірки. Висновок полягає в тому, що «незалежно від того, яка технологія використовується, не можна розраховувати на зменшення кількості зразків для досягнення мети зниження вимог до надійності», оскільки малий розмір вибірки сам по собі вносить упередження.
Якщо потрібно послабити вимоги до надійності, як слід визначити стандарт?
20 років тому GR468 був еталоном у галузі оптичного зв’язку. Насправді ще в 2004 році існував стандарт надійності під назвою GR3013 для короткого життєвого циклу.
Однак цей новий стандарт із послабленими вимогами до надійності маловідомий, принаймні я чув про нього.
Сьогодні вдень основні виробники все ще використовували GR468 для аналізу.
Отже, чи повинен послаблений стандарт надійності бути абсолютно новою серією стандартів? Це несе в собі ризик чогось подібного до GR3013 — промисловість витрачає тривалий час на розробку стандартів, а потім вони залишаються невідомими…
Варіант другий: змінити GR3013 і впровадити його, а потім просувати.
Третій варіант: розробити більш м’яку версію CR468, придатну для центрів обробки даних.
Це дуже специфічне питання в галузевому ланцюжку-як це реалізувати?
Фундаментальне питання: «Чи зменшаться витрати, якщо стандарти надійності будуть послаблені?»
Що отримають оператори центрів обробки даних від зниження вимог до надійності? Низька вартість — їхня основна мета. Лазери мають найвищий відсоток відмов. Однак такі виробники, як Sumitomo та Broadcom, які виробляють лазери, використовували текст, формули та діаграми, щоб передати повідомлення про те, що послаблення вимог до надійності не зменшує витрати. Насправді це збільшує витрати, якщо процес перевірки надійності лазерних пластин змінюється.
Для лазерів надійність залежить від постійного технологічного вдосконалення. Пом'якшення вимог до надійності не є способом зниження витрат. Як було сказано в одному реченні в презентації Broadcom: «Подумайте про інші способи скорочення витрат...»


