Chuyện của sys

DevOps Blog

Cấu hình Load Balancing và Reverse Proxy sử dụng HAproxy và keepalived cho Web Server trên CentOS 6 June 29, 2015

Giới thiệu:
HAproxy là phần mềm cân bằng tải TCP/HTTP và là giải pháp reverse proxy mã nguồn mở phổ biến, thường được sử dụng kết hợp với keepalived đem lại 1 giải pháp high availability hữu hiệu với giá thành thấp hơn so với việc sử dụng các giải pháp cân bằng tải khác (dựa trên phần cứng).
Bài viết sẽ cung cấp 1 số các khái niệm có liên quan đến proxy, reverse proxy, các thuật toán cân bằng tải cho bộ cân bằng tải, HAproxy và các khái niệm liên quan, keepalived… Bài viết còn trình bày thêm hướng dẫn cấu hình giải pháp high availability cho hệ thống sử dụng HAproxy kết hợp keepalived trên CentOS 6
Các khái niệm:

  • Proxy

Proxy là 1 internet server làm nhiệm vụ chuyển tiếp, kiểm soát thông tin giữa client và server, proxy có 1 địa chỉ IP và 1 port cố định. Cách thức hoạt động: tất cả các yêu cầu từ client gửi đến server trước hết phải thông qua proxy, proxy kiếm tra xem yêu cầu nếu được phép sẽ gửi đến server và cũng tương tự cho server.
– Forward proxy: Là khái niệm proxy chúng ta dùng hàng ngày, nó là thiết bị đứng giữa 1 client và tất cả các server mà client đó muốn truy cập vào.
– Reverse proxy: là 1 proxy ngược, nó đứng giữa 1 server và tất cả các client và server mà server đó phục vụ, tương tự 1 nhà ga kiêm 1 trạm kiểm soát, các yêu cầu từ client gửi lên server bắt buộc phải ghé vào reverse proxy, tại đây yêu cầu sẽ được kiếm soát, lọc bỏ, và luân chuyển đến server. Ưu điểm của nó là khả năng quản lý tập trung, giúp chúng ta có thể kiếm soát mọi yêu cầu do client gửi lên server mà chúng ta cần bảo vệ.

  • Các kỹ thuật cân bằng tải

Các phần mềm cân bằng tải thường được cài đặt như 1 proxy, các kỹ thuật cần phải chú trọng đó là: kiểm tra trạng thái server (health checks), lựa chọn server tốt nhất để gửi yêu cầu và kỹ thuật duy trì kết nối của người dùng.
– Kiểm tra trạng thái server: có thể kiếm tra server bằng lệnh ping hoặc 1 phương pháp nào khác
– Lựa chọn server tốt nhất dựa trên các thuật toán cân bằng tải ( RR,…)
– Kỹ thuật Session Persistence: duy trì kết nối cho yêu cầu của người dùng trong suốt phiên làm việc, tất cả các yêu cầu của người dùng cần phải chuyển đến cùng 1 server, nếu server chết hoặc ngừng để bào trì , cần có cơ chế để chuyển session qua 1 server khác, cookie là phương pháp được sử dụng.

  • Các thuật toán cân bằng tải

– Thuật toán Round Robin (RR): phương pháp chia tải xoay vòng, hoạt động tốt với các server có khả năng xử lý tương tự nhau, điểm yếu của nó là 2 yêu cầu liên tục từ phía 1 người dùng có thể sẽ được gửi vào 2 server khác nhau, nên thường được cài đặt cùng với phương pháp duy trì session như sử dụng cookie.
– Thuật toán Weighted Round Robin (Ratio): tương tự như RR nhưng có quan tâm đến khả năng xử lý của các server, trong 1 chu kỳ 1 server có khả năng xử lý gấp đôi server khác sẽ nhận được gấp đôi số yêu cầu từ phía bộ cân bằng tải.
– Thuật toán Least Connections (LC): yêu cầu từ phía client sẽ được chuyển vào server có ít kết nối nhất trong hệ thống vào thời điểm đó.
Ngoài ra còn nhiều thuật toán khác được sử dụng.

  • HAproxy và các khái niệm liên quan

Haproxy là ứng dụng chạy độc lập, tất cả những gì người dùng cần phải làm là cài đặt HAproxy lên 1 máy server và thiết lập file cấu hình, trong đó ghi rõ địa chỉ cài đặt HAproxy và địa chỉ của các máy server. Mỗi server sẽ được cài đặt các thông số khác nhau về địa chỉ, cookie, trọng số… File cấu hình này cũng thiết lập các thông số về timeout của session, số lượng kết nối lớn nhất, cookie, thuật toán căn bằng tải, ACLs…

Các thuật ngữ cần quan tâm:
– ACL ( Access control list): Dùng để test 1 số điều kiện và thực hiện 1 hành động như lựa chọn máy chủ hoặc khóa 1 yêu cầu dựa trên kết quả kiếm tra. Dùng ACLs cho phép chuyển hướng lưu lượng mạng 1 cách linh động dựa trên nhiều tác nhân giống như pattern-matching và 1 số kết nối đến backend.
Ví dụ: acl url_static path_beg -i /static /images /javascript /stylesheets
Những url có đường dẫn bắt đầu bằng /static /images sẽ được gán cho url_static
– Backend : là tập hợp các server mà nhận các yêu cầu được chuyển hướng. Được định nghĩa trong phần backend trong file cấu hình với thông tin cơ bản như sau: thuật toán cân băng tải sử dụng và danh sách các máy chủ và port.
Một backend có thể chứa 1 hoặc nhiều máy chủ ở trong nó.
– Frontend: định nghĩa cách thức các yêu cầu sẽ được chuyển hướng đến backend, được định nghĩa trong phần frontend trong file cấu hình, định nghĩa bao gồm các thành phần: tập hợp các địa chỉ ip và cổng, ACLs, các quy tắc sử dụng backend (định nghĩa backend nào được sử dụng phụ thuộc vào điều kiện ACLs có khớp hay không hoặc 1 quy tắc default_backend để xử lý các trường hợp còn lại.
Ví dụ:
frontend main *:80 # toàn bộ ip port 80
acl url_static path_beg -i /static /images /javascript /stylesheets   # đường dẫn bắt đầu bằng
acl url_static path_end -i .jpg .gif .png .css .js     # đường dẫn kế thúc bằng
use_backend static if url_static # sẽ sử dụng backend static nếu như match ACL
default_backend app   # mặc định sẽ sử dụng backend defualt là app.

  • keepalived

là 1 phần mềm định tuyến được viết bằng C, cung cấp 1 công cụ đơn giản và mạnh mẽ cho việc cần bằng tải và HA cho hệ thống. Nói đơn giản hơn là keepalived dùng để cung cấp IP Failover cho 1 cluster. Cho phép 2 bộ cân bằng tải cài đặt cùng với nó hoạt động theo cơ chế active/backup.

Mô hình
topo
Trong đó:
GW1: server CentOS 6, đóng vai trò là Master
GW2: server CentOS6, đóng vai trò là Backup
APP1: server Ubuntu 14.04, chạy Apache
APP2: server Ubuntu 14.04, chạy Apache
(trong bài viết này không đề cập tới việc cài đặt và cấu hình Apache Web Server)
Card eth0 nối với public network, card th1 nối với private network
HAproxy được cài đặt trên cả 2 server GW1 và GW2, listen trên ip 192.168.1.200, đóng vai trò là reverse proxy.
ip 192.168.1.200: ip ảo được tạo ra từ GW1 và GW2 thông qua keepalived
IP list:

192.168.1.128 gw1
192.168.1.130 gw2
172.16.1.132 app1
172.16.1.133 app2
192.168.1.200 vip
Cài đặt haproxy và keepalived trên cả 2 server GW1 và GW2 bằng lệnh yum
yum -y install haproxy keepalived
Cấu hình keepalived
! Configuration File for keepalived
/etc/keepalived/keepalived.conf
#————————————————————————–#
# Global define để xác nhận thông tin notic qua email                      #
# ————————————————————————-#
global_defs {
   notification_email {
   }
   notification_email_from [email protected]
   smtp_server localhost
   smtp_connect_timeout 30
}
#————————————————————————–#
# Define Script để kiểm tra process haproxy                                #
# ————————————————————————-#
vrrp_script chk_haproxy {
  script “killall -0 haproxy” # check the haproxy process
  interval 200 # every 2 seconds
  weight 2 # add 2 points if OK
}
#————————————————————————–#
# VRRP                                                                     #
# ————————————————————————-#
vrrp_instance VI_1 {
    state MASTER            # MASTER ở gw1 , BACKUP ở gw2
    interface eth0          # interface để tạo ip ảo
    virtual_router_id 51
    priority 101            # độ ưu tiên, ở MASTER 101, ở BACKUP 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.1.200       # ip ảo
    }
    track_script {
        chk_haproxy         # chạy script
    }

}

Khởi động keepalived:
service keepalived start
Sau đó kiểm tra hoạt động của keeaplived trên 2 server GW1 và GW2 (*)
Cấu hình haproxy
#———————————————————————
# Global settings
#———————————————————————
global
log         127.0.0.1 local2
chroot      /var/lib/haproxy
pidfile     /var/run/haproxy.pid
maxconn     4000
user        haproxy
group       haproxy
daemon# turn on stats unix socket
stats socket /var/lib/haproxy/stats#———————————————————————
# common defaults that all the ‘listen’ and ‘backend’ sections will
# use if not designated in their block
#———————————————————————
defaults
mode                    http
log                     global
option                  httplog
option                  dontlognull
option http-server-close
option forwardfor       except 127.0.0.0/8
option                  redispatch
retries                 3
timeout http-request    10s
timeout queue           1m
timeout connect         10s
timeout client          1m
timeout server          1m
timeout http-keep-alive 10s
timeout check           10s
maxconn                 3000    # Number of maximum connections#———————————————————————
# main frontend which proxys to the backends
#———————————————————————
frontend  main *:80
acl url_static       path_beg       -i /static /images /javascript /stylesheets
acl url_static       path_end       -i .jpg .gif .png .css .js#    use_backend static          if url_static
default_backend             app#———————————————————————
# static backend for serving up images, stylesheets and such
#———————————————————————
backend static
balance     roundrobin
server      static 127.0.0.1:4331 check
#———————————————————————
# round robin balancing between the various backends
#———————————————————————
backend app
balance     roundrobin       # sử dụng thuật toán RR
cookie webpool prefix        # sử dụng cookie rewrite
server  app1 172.16.1.132:80 cookie webpool-app1 check
server  app2 172.16.1.133:80 cookie webpool-app2 check
listen stats 192.168.1.200:1991   # lắng nghe qua ip ảo
stats uri /haproxy            # Link truy cập xem status của haproxy
stats enable                  # truy cập qua web
stats auth root:123456        # user và password đăng nhập
Cho haproxy và keepalived khởi động cùng hệ thống
chkconfig haproxy on
chkconfig keepalived on
service haproxy start
Như vậy bạn đã thực hiện xong phần cài đặt và cấu hình haproxy cho hệ thống, sau đó bạn tiến hành các bước kiểm tra và bắt đầu sử dụng hệ thống của bạn.
Link tham khảo:
http://www.haproxy.org/download/1.4/doc/configuration.txt
https://aaronwalrath.wordpress.com/2011/06/28/configure-haproxy-and-keepalived-for-load-balancing-and-reverse-proxy-on-red-hatscientificcentos-linux-56/
1 Comment on Cấu hình Load Balancing và Reverse Proxy sử dụng HAproxy và keepalived cho Web Server trên CentOS 6
Categories: Cũ hơn

Rsync – Remote sync June 9, 2015

Giới thiệu sơ lược:
Rsync (Remote sync), là 1 công cụ đồng bộ dữ liệu( file, thư mục) giữa các remote server hoặc local thường được sử dụng trong môi trường *nix thay cho lệnh cp thông thường.

Một số đặc điểm:

  • Rsync đồng bộ hóa 2 nơi bằng cách copy dữ liệu theo dạng block (mặc định) chứ không copy theo dạng file(có option riêng hỗ trợ) , bên tốc độ được cải thiện nhiều khi áp dụng với file, thư mục có dung lượng lớn.
  • Rsync cho phép mã hóa dữ liệu trong qúa trình tranfer sử dụng ssh, nên qúa trình này được bảo mật.
  • Rsync cho phép tiết kiệm băng thông bằng phương pháp nén dữ liệu ở nguồn và giải nén ở đích, tuy nhiên việc này tốn thêm 1 lượng thời gian đáng kể.
  • Một điểm đặc biệt của rsync là cho phép giữ nguyên được tất cả các thông số của thư mục và file (sử dụng tham số -a)  : Recursive mode, Symbolic links, Permissions, TimeStamp, Owner và group
  • Rsync không yêu cầu quyền super-user.
  • (Xem thêm qua man rsync)

Cài đặt:
Cài đặt tương đối dễ dàng trong tất cả các bản phân phối
Cách sử dụng:
Câu lệnh chung:

rsync -options SRC DEST

  • Đồng bộ hóa trên local:

rsync -a ~/backup-Code/ ~/tmp/

  • Push lên remote server:

rsync -a /home/nhanpt5/backup-Code/ [email protected]:~/Codebk/Push

  • Pull từ remote server:

rsync -a [email protected]:~/Codebk/Push /home/nhanpt5/backup-Code/Pull
Một số tham số cần biết (flags):
-v: hiển thị kết quả
z: dữ liệu trên đường truyền sẽ được nén lại. Có nghĩa là nén ở nguồn và giải nén ở đích, điều này giúp tiết kiệm băng thông khi phải đồng bộ một lượng dữ liệu lớnd
-d: chỉ đồng bộ cây thư mục, không đồng bộ file
-P: quan sát qúa trình đồng bộ dữ liệu
-a: cho phép giữ nguyên được tất cả các thông số của thư mục và file
Một số tùy chọn cần biết (options):
-delete : Xóa file, thư mục ở đích
Sử dụng option –delete nếu bạn ở trong trường hợp sau: Nếu muốn đồng bộ hoàn toàn giữa 2 nơi, các file, folder ở đích mà không tồn tại ở server nguồn sẽ bị xóa bỏ để đảm bảo server đích là bản sao hoàn chỉnh của server nguồn.
-u: không ghi đè dữ liệu ở thư mục đích
Sử dụng option –u trong trường hợp bạn chỉ muốn đồng bộ những file, folder chưa tồn tại ở server đích. Những file đã tồn tại (đã được đồng bộ rồi) thì không đồng bộ nữa.
-existing: không tạo file mới ở đích
Chỉ muốn sync các file đã tồn tại ở đích (kiểu như update), không tạo các file mới. Sử dụng option -existing
-W:
Nếu bạn có băng thông rộng, CPU xử lý tốt, bạn có thể sử dụng option này để copy theo file. Ưu điểm là tốc độ sẽ nhanh hơn, không checksum tại server nguồn và đích. Sử dụng option -W
Ngoài ra còn nhiều tham số khác, tham khảo thêm phần man rsync
Áp dụng:
Rsync không hỗ trợ phần lập lịch tự động backup nên thường được sử dụng kèm với 1 công cụ khác để thực hiện 1 số công việc nhất định. Ví dụ: Dùng crontab kết hợp rsync, ssh để thực hiện việc push dữ liệu lên server hàng ngày. Ta sẽ thực hiện như sau:

Kịch bản:
Backup thư mục ~/Code hàng ngày (server local) và gửi lên server(192.168.1.128) chứa code tại thư mục ~/Codebk
Thiết lập chứng thực ssh bằng private key, đăng nhập server 192.168.1.128 không cần mật khẩu.
1. Dùng script backupfile để nén thư mục: vi ~/backup-Code/backupfile
#!/bin/bash
date=$(date +”%m-%d-%Y”)
filename=$date-backup.zip
source_folder=/home/nhanpt5/Code
dest_folder=/home/nhanpt5/backup-Code
# add folder to zip file
zip -r $dest_folder/$filename $source_folder > /dev/null
Cho chạy vào 3 a.m hàng ngày bằng cron
2. Dùng script tranfer để chuyển file backup lên server và xóa file ở local
#!/bin/bash
date=$(date +”%m-%d-%Y”)
filename=$date-backup.zip
dest_folder=/home/nhanpt5/backup-Code
#tranfer zip file to remote server dùng rsync
rsync -av $dest/$filename  [email protected]:~/Codebk/
#delete zip file
rm -f $dest_folder/$filename
Cho chạy vào 3.30 a.m hàng ngày bằng cron
Thông tin crontab -l
0 3 * * * ~/backup-Code/backupfile
30 3 * * * ~/backup-Code/tranfer >~/backup-Code/bk.log 2>&1
2 Comments on Rsync – Remote sync