- Replace 12-item flat menu with 4-item main menu: Health Check, Export support bundle, Settings, Exit - Add Health Check screen (Lenovo-style): per-component checkboxes (GPU/MEM/DISK/CPU), Quick/Standard/Express modes, Run All, letter hotkeys G/M/S/C/R/A/1/2/3 - Add two-column main screen: left = menu, right = hardware panel with colored PASS/FAIL/CANCEL/N/A status per component; Tab/→ switches focus, Enter opens component detail - Add app.LoadHardwarePanel() + ComponentDetailResult() reading audit JSON and SAT summary.txt files - Move Network/Services/audit actions into Settings submenu - Export: support bundle only (remove separate audit JSON export) - Delete screen_acceptance.go; add screen_health_check.go, screen_settings.go, app/panel.go - Add BMC + CPU stress-ng tests to backlog - Update bible submodule - Rewrite tui_test.go for new screen/action structure Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
4.5 KiB
Backlog
BMC версия через IPMI
Статус: не реализовано.
Добавить сбор версии BMC firmware в board collector:
- Команда:
ipmitool mc info→ полеFirmware Revision - Записывать в
hardware.firmware[]как{device_name: "BMC", version: "..."} - Показывать в TUI правой колонке рядом с BIOS версией
- Graceful skip если
/dev/ipmi0отсутствует (silent: same pattern as PSU collector)
CPU acceptance test через stress-ng
Статус: не реализовано. CPU в Health Check всегда N/A.
Добавить CPU SAT на базе stress-ng:
- Bake
stress-ngв ISO (добавить вbee.list.chroot) - Новый
bee sat cpu— запускаетstress-ng --cpu 0 --cpu-method all --timeout <N>где N = duration из режима (Quick=60s, Standard=300s, Express=900s) - Параллельно снимает температуры через
sensorsи throttle-флаги из аудит JSON - Результат: SAT архив с summary.txt в формате других SAT (overall_status=OK/FAILED)
- После реализации: CPU в Health Check получает реальный PASS/FAIL статус
Real hardware validation
Статус: ожидает доступа к железу.
Что осталось подтвердить на практике:
bee sat nvidiaна реальном NVIDIA GPU hostbee sat storageна NVMe/SATA/RAID hostipmitool sdrparsing на сервере с реальным BMC/IPMI- vendor RAID tooling (
storcli64,sas2ircu,sas3ircu,arcconf,ssacli) в живом ISO
SAT result polish
Статус: частично закрыто.
Что ещё можно улучшить после полевой проверки:
- точнее классифицировать vendor-specific self-test outputs в
storage SAT - подобрать дефолты
memtesterпо объёму RAM на целевых машинах - при необходимости расширить
bee-gpu-stressпо длительности/нагрузке
Hardware Contract backlog
Статус: уточнён, сокращён до bee-only snapshot scope.
Не backlog для bee
Эти задачи не должны реализовываться в bee, потому что относятся к централизованному ingest/lifecycle слою:
status_historystatus_changed_at- определение замены компонента между snapshot'ами
- timeline/lifecycle/history по diff между экспортами
bee отвечает только за текущий snapshot железа и status_checked_at.
Реализуемо инкрементально
Эти поля можно развивать дальше по мере появления реальных sample outputs и vendor-specific parser'ов:
cpus.correctable_error_countcpus.uncorrectable_error_countpower_supplies.life_remaining_pctpower_supplies.life_used_pctpcie_devices.battery_charge_pctpcie_devices.battery_health_pctpcie_devices.battery_temperature_cpcie_devices.battery_voltage_vpcie_devices.battery_replace_required
Vendor/platform-specific, часто пустые
Эти поля допустимо оставлять пустыми на части платформ даже после реализации parser'ов:
power_supplies.life_remaining_pctpower_supplies.life_used_pct- часть
pcie_devices.battery_*для неподдержанных RAID/NIC/GPU вендоров
Unsupported в bee
Эти поля считаются нереалистичными для общего OS-level hardware snapshotter без synthetic/fake data:
cpus.life_remaining_pctcpus.life_used_pctmemory.life_remaining_pctmemory.life_used_pctmemory.spare_blocks_remaining_pctmemory.performance_degraded
Причина: у обычного Linux-host audit обычно нет честного vendor-neutral runtime source для этих метрик.
Эти поля считаются дропнутыми из backlog bee и не должны возвращаться в план работ без появления нового доказуемого локального источника данных на целевых машинах.