T2-AH1 に Debian インストール

computer — Hidekichi @ 2006/8/1 火曜日

前回までのあらすじ。

IntelはPentium4以降の失敗でAMDの躍進を許してしまう。状況を打開するために投入されたのはCore2Duo。それに対しAMDは価格の引き下げで対抗。今、PCを組み立てるのなら、Core2Duoを待っても良し、AMDでお安く組むのも良しという状況になっていた。

ひできち的には、そろそろ自宅サーバのシステムを入れ替えたい。apacheはそろそろ2.0でいいんじゃないかとか、mysqlは一度派手に飛ばしたからマシンを入れ替えてからもう一度とか、64ビットマシンで遊んでみたいとか、サーバにはデュアルがよさそうとか。

そういうわけで現サーバ Terminator TUの後継として、 Terminator2-AH1を購入。CPUにはAMD Athlon 64 X2 3800+を選択。メモリとCDROMドライブは適当に転がっていたものを取り付け、夏休みに備えていた。

ちょっとあらすじが長すぎた。

そうこうしているうちに夏休みなんである。で、ハードディスクを購入したのだ。
Hitachi Deskstar 250GB SATA HDT722525DLA380 こいつを2台。
SATAのケーブルはTerminatorに1本しか付いてこなかったので追加で1本購入。

ハードディスク一つ目は、元々用意されている3.5インチハードディスク用のスペースへ。SATAの信号用ケーブルと、レガシーの電源ケーブルを接続。電源ケーブル、SATAのはライトアングルになってなかったので、ケースと干渉しそうだったのだ。

あらかじめDebian-Installer から名刺サイズの CD イメージ (20-50 MB)のAMD64版をダウンロード、CDに焼いておいたものをTerminatorで起動!

なんの問題も無くインストールが完了。sargeやetchの古いビルドだとAMD64対応やSATAがらみでトラブルがあるらしいことを小耳に挟んでいたので、etchの最新を試したのだが今のところ正解だったようだ。

次はRAID1用の2個目のハードディスク取り付け。これが困った。5インチドライブベイに置くか、フロッピーの場所にするか。しばらく悩んで、フロッピーの場所を横取りすることにした。フロッピーも外されて、消費電力もちょっと減るだろと。放熱の面で心配なので、やばそうなら5インチのベイへ移動予定。

電源投入直後のRAID設定画面でCtrl-A。
Create RAID 1 Mirroring for Reliability を選択
Channnel 0 Master から Channel 1 Master へ
RAIDの名前を付けさせられるが、今回はそのまま「ULi_RAID」で。
RAID1作成!
RAID構築中。長い。ひたすら長い。1時間くらい消費

RAID構築後、も特に問題なく起動完了。ハードディスクの温度が気になるので、hddtempを入れてみる。

t2ah1:/# apt-get install hddtemp
t2ah1:/# hddtemp /dev/sda
WARNING: Drive /dev/sda doesn’t appear in the database of supported drives
WARNING: But using a common value, it reports something.
WARNING: Note that the temperature shown could be wrong.
WARNING: See –help, –debug and –drivebase options.
WARNING: And don’t forget you can add your drive to hddtemp.db
/dev/sda: HDT722525DLA380: 39°C or °F

そんなハードディスク知らないといわれてしまったので、
/etc/hddtemp.db に以下を追記。

“HDT722525DLA380″ 194 C “Hitachi Deskstar 250GB SATA”

t2ah1:/# hddtemp /dev/sda
/dev/sda: HDT722525DLA380: 40°C

RAID用のもう一個のHDDも試してみる。
t2ah1:/etc# hddtemp /dev/sdb
/dev/sdb: HDT722525DLA380: 38°C

温度を見る分には問題ないようだ。

RAIDのディスクの異常をどう感知するか。とりあえずSMARTでやってみる。

t2ah1:/# apt-get install smartmontools
t2ah1:/# smartctl -a /dev/sda
smartctl version 5.36 [x86_64-unknown-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Device: ATA HDT722525DLA380 Version: V44O

In Linux, SATA disks accessed via libata are only supported by smartmontools
for kernel versions 2.6.15 and above. Try an additional ‘-d ata’ argument.

t2ah1:/# smartctl -a /dev/sda -d ata
smartctl version 5.36 [x86_64-unknown-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: HDT722525DLA380
Serial Number: VDS41DT4EKPNRJ
Firmware Version: V44OA96A
User Capacity: 250,059,350,016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 1
Local Time is: Mon Jul 31 16:55:55 2000 JST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0×00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (4797) seconds.
Offline data collection
capabilities: (0×5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0×0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0×01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 80) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0×000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0×0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0×0007 100 100 024 Pre-fail Always - 302
4 Start_Stop_Count 0×0012 100 100 000 Old_age Always - 6
5 Reallocated_Sector_Ct 0×0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0×000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0×0005 100 100 020 Pre-fail Offline - 0
9 Power_On_Hours 0×0012 100 100 000 Old_age Always - 11
10 Spin_Retry_Count 0×0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0×0032 100 100 000 Old_age Always - 6
192 Power-Off_Retract_Count 0×0032 100 100 050 Old_age Always - 6
193 Load_Cycle_Count 0×0012 100 100 050 Old_age Always - 6
194 Temperature_Celsius 0×0002 114 114 000 Old_age Always - 48 (Lifetime Min/Max 25/52)
196 Reallocated_Event_Count 0×0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0×0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0×0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0×000a 200 253 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

Warning! SMART Selective Self-Test Log Structure error: invalid SMART checksum.
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0×0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

t2ah1:/# smartctl -a /dev/sdb -d ata
smartctl version 5.36 [x86_64-unknown-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: HDT722525DLA380
Serial Number: VDS41DT4EKK88J
Firmware Version: V44OA96A
User Capacity: 250,059,350,016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 1
Local Time is: Mon Jul 31 16:56:37 2000 JST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0×00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (4797) seconds.
Offline data collection
capabilities: (0×5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0×0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0×01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 80) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0×000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0×0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0×0007 100 100 024 Pre-fail Always - 311
4 Start_Stop_Count 0×0012 100 100 000 Old_age Always - 5
5 Reallocated_Sector_Ct 0×0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0×000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0×0005 100 100 020 Pre-fail Offline - 0
9 Power_On_Hours 0×0012 100 100 000 Old_age Always - 9
10 Spin_Retry_Count 0×0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0×0032 100 100 000 Old_age Always - 5
192 Power-Off_Retract_Count 0×0032 100 100 050 Old_age Always - 5
193 Load_Cycle_Count 0×0012 100 100 050 Old_age Always - 5
194 Temperature_Celsius 0×0002 117 117 000 Old_age Always - 47 (Lifetime Min/Max 25/48)
196 Reallocated_Event_Count 0×0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0×0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0×0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0×000a 200 253 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

Warning! SMART Selective Self-Test Log Structure error: invalid SMART checksum.
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0×0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

ハードディスクの監視は、smartdにやってもらうことにする。

/etc/smartd.conf
/dev/sda -a -d ata
/dev/sdb -a -d ata
/dev/sda -H -m hogehoge@ドメイン
/dev/sdb -H -m hogehoge@ドメイン

/etc/default/smartmontools
start_smartd=yes

t2ah1:/# /etc/init.d/smartmontools restart
Restarting S.M.A.R.T. daemon: smartd (failed)

ありゃ、うまくsmartdが立ち上がらない。後回しにすることにする。

現状の問題点を整理すると
・サウスブリッジの機能を使ったRAID1で、ハードディスクの故障検知をする方法としては、SMART以外に有るのかが分からない。
・SMARTのデーモン、smartdがうまく起動しないので、故障時にメールが飛んでこない。
・(おまけ)のフロントパネルの時刻表示がGMTになってる。日本標準時に変更する方法が不明。
てなところか。

関連する投稿


コメント (0) »

この記事にはまだコメントがついていません。

コメント RSS

コメントをどうぞ

段落や改行は自動挿入です。メールアドレスはサイト上では非表示です。
使用できる HTML タグ: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

HTML convert time: 2.419 sec. Powered by WordPress ME