Giám sát hiệu năng máy chủ

Cập nhật: 14:37 Ngày 06/10/2016

Giám sát hiệu năng máy chủ
Chuẩn bị : 1 máy chạy HDH server 2012.

Chuẩn bị

Mục đích của việc giám sát hiệu năng:

+ Giám sát hoạt động của server về phần cứng (để ghi ra những chỉ số cụ thể). Đễ khi có sự cố, khi có sự phàn nàn của người dùng thì ta lại monitoring một lần nữa để có được chỉ số trong thời  gian người dùng phàn nàn rồi so sánh với chỉ số ban đầu ( để việc đề xuất mua thiết bị có sức thuyết phục hơn).

+ Xác định thành phần nào gây ra hiện tượng hoạt động kém đối với server. CPU, Ram, Ổ cứng v.v. Vậy ai gây ra ???. Nhờ các chỉ số so sánh ta có thể biết được thủ phạm .

Trên 1 server hay máy tính bất kì ta có 4 thành phần cần quan tâm:

+ RAM

+ CPU

+ Physical Disk (Ổ cứng vật lý).

+ Card mạng (NIC)

Ram, Cpu, Ổ cứng: quyết định trực tiếp đến hiệu năng máy tính. NIC quyết định đến chất lượng mạng (nếu copy qua mạng chậm thì do NIC gây ra nhiều nhất, sau đó là ổ cứng rồi đến cpu, ram.)

Khi giám sát (monitor) ta có công cụ rất quen thuộc là Task Manager. Task Manager chỉ giám sát thời gian thực. Muốn đi giám sát chính xác thì cần có thời gian lâu dài rồi tính giá trị trung bình cho nó.

Công cụ Windows hỗ trợ để xét hiệu năng là: Performance Monitor. Có 2 cách mở

Cách 1: perfmon.msc

Cách 2: Mở Server Manager -> Performance Monitor Mỗi một phần cứng có nhiều giá trị để giám sát, ta cần nhớ các gá trị quan trọng sau:

+ RAM: Giá trị cần quan tâm: Pages/Sec (second). Giá trị cho phép : 0->20. Càng thấp càng tốt. Mới mua về mà >20 thì đầu tư server thiếu RAM.

+ CPU: Giá trị cần quan tâm: %Processor Time. Giá trị cho phép: <85%. Càng thấp càng tốt. Nếu chỉ số > 85%  => tốc độ xử lý cpu yếu. Cần nâng cấp cpu ( thêm cpu hoặc thay cpu mới).

+ Physical Disk:

Ta cần quan tâm 2 giá trị

% disk time: Giá trị cho phép : < 50% càng thấp càng tốt

Current Disk Queue Length: ( còn gọi là Average disk Queue length).  Giá trị cho phép từ 0->2. Càng thấp càng tốt

Nếu %disk time cao >50%: tốc độ vòng quay của ổ cứng (HDD) không đủ nhu cầu truy suất trên hệ thống (chậm quá) Current disk Queue length >2:  thông số kĩ thuật trên ổ cứng không hợp lý ( cụ thể là thông số cache, cache nhỏ => Current disk Queue length lớn, mỗi lần cpu cần truy suất thông tin ổ cứng thì đợi rất lâu => làm treo máy, windows tự restart ( do cpu không có dữ liệu xứ lý, hdh tưởng là bị lỗi nên sẽ restart).

NIC (network interface)

Ta cần quan tâm đến giá trị: Bytes Total/sec:  càng cao càng tốt. Không có giá trị cụ thể. Thời gian đầu mới mua, ta đo giá trị Bytes Total/sec , ta sẽ đặt nó làm giá trị ban đầu gọi là X (phải thỏa tiêu chuẩn của Microsoft cộng với việc 100% người dùng hài lòng với chất lượng truy suất mạng thì giá trị này X mới thỏa yêu cầu). Sau thời gian sử dụng, nếu người dùng than phiền thì ta lại so sánh giá trị hiện tại với giá trị X. Nếu thấp hơn thì cần nâng cấp.

Triển khai:

Run -> perfmon.msc Bung Monitoring Tools -> Performance Monitor .

Ta có 2 chế độ giám sát

1/ Real Time Mode ( giám sát theo thời gian thực)

+ Dùng Task Manager

+ Dùng Performance Monitor

performance 1

Chọn vào đồ thị -> Properties

performance 2

 

Tab Grap, bung View , Windows cung cấp co ta 3 dạng biểu đồ để giám sát

 

 

 

performance 3

+ Line: dạng đồ thị (mặc định)

+ Histogram Bar: dạng biểu đồ cột

+ Report : chỉ xuất ra dạng số

performance 4

dạng Report

 

Mặc định Performance Monitor chỉ giám sát CPU theo thời gian thực, muốn xem các chỉ số khac ta làm như sau. Chọn vào đồ thị ->

Add counters. Giả sử ta muốn giám sát them Memory (add Pages/sec)performance 5

Các thành phần giám sát sẽ chung 1 bảng đồ thị ( chung 1 hệ trục), ta cần đổi màu cho từng thành phần

Chọn Pages/sec -> Properties -> Tab Data

performance 6

 

 

 

 

 

performance 7

Lưu ý: Khi dùng Performance Monitor giám sát card mạng, nếu server có nhiều card mạng thì cũng chỉ có 1 hệ trục duy nhất. Khác với Task Manager, nhiều card mạng thì có nhiều bảng giám sát.

2/ Logging Mode ( chế độ giám sát ghi vào log file). Đây là chế độ không chỉ giám sát mà còn ghi lại các giá trị

Để triển khai Logging Mode, ta cần tạo các Data Collector.

Một Data Collector bao gồm 2 yếu tố

+ Object: đối tượng cần giám sát.

+ Counter: thông số cần ghi nhận

performance 8

 

Data Collector Set: là tập hợp các Data Collector

Mặc định hệ thống cấu hình sẵn 1 số Datacollector, Để tạo Data Collector Set theo ý mình.

Ta chọn User Defined -> New -> Data Collector Set

Name: Monitoring System. Check vào Create Manually ( vì ta sẽ giám sát theo ý mình, không làm theo templates). -> NEXT

performance 9

 

Chọn Performance Counter để giám sát hệ thống -> Finish

 

performance 10

 

Chọn vào Monitoring System vừa tạo -> New -> Data Collector

performance 11

 

performance 12

 

 

Cửa sồ Create New Data Collector -> Add

performance 13

Add các thông số như hình

Riêng với Network Interfaces -> ta chọn Counter rồi chỉ định Card mạng nào muốn giám sát ( muốn giám sát bao nhiêu card thì add thêm bấy nhiêu lần).

Lưu ý: Logical Disk dùng để giám sát các phân vùng của ổ cứng, nhờ đó mà ta có thể xác định phân vùng nào là nguyên nhân, ta cũng có thể xác định được ứng dụng hay  dịch vụ nào đang yêu cầu (request).

Physical Disk: giám sát cả ổ cứng. Ở vd này ta chọn Logical Disk.

-> NEXT

performance 14

 

Sam Interval: bao nhiêu lâu thì ghi dữ liệu 1 lần. Ta để mặc định 15 giây để test ( thực tế nên để 15 phút).

-> Next

Check vào: Open properties for this data collector -> Finish

performance 15

 

Chọn vào Data Collector “ Performance” vừa tạo -> properties

Log Format: chọn Tab Seperated để có thể đọc file log bằng phần mềm Microsoft Excel.

performance 16

 

Sau đó chọn Data Collector Set “ Monitoring System” ->Properties

Tab Directory

Root Directory: nơi lưu trữ log file ( ta có thể chỉnh sửa nơi lưu trữ). Mặc định lưu ở: %systemdrive%Perflogs.

Để lập lịch biểu chọn tab Schedule: dùng để lập lich cho Data Collector Set chạy

 

 

performance 17

Cứ 10h là chạy. Chạy từ 9/10 -> 31/10. Chạy từ thứ 2 -> thứ 6. Apply -> OK

 

Cách Test:

chọn vào Monitoring System -> Start ( để khoảng 1 phút).

performance 19

Sau đó stop  rồi mở log file bằng excel.

performance 20

 

Để cột Network có giá trị thì chúng ta phải copy 1 file nào đó qua mạng ( từ server qua client).