Chặn đứng SSRF: Hướng dẫn bảo mật nâng cao cho API và Web

Table of Contents

Mối đe dọa SSRF: Khi máy chủ của chính bạn phản chủ

Server-Side Request Forgery (SSRF) là một kiểu “nội gián” nguy hiểm. Trong khi các cuộc tấn công XSS thông thường nhắm vào người dùng, thì khai thác SSRF lại đánh lừa chính backend của bạn trở thành kẻ tấn công. Nó buộc máy chủ phải lấy dữ liệu từ các tài nguyên nội bộ—như bộ nhớ đệm Redis hoặc dịch vụ metadata trên đám mây—những thứ vốn không bao giờ được phép lộ ra ngoài.

Cuộc gọi lúc 3 giờ sáng: Bảo mật mặc định (Security by Default)

Tôi đã học được giá trị của “Bảo mật mặc định” (Security by Default) một cách đầy cay đắng—khi phải nhìn chằm chằm vào màn hình terminal đầy nhật ký tấn công SSH brute-force lúc 3 giờ sáng. Trải nghiệm đó đã củng cố một quy tắc sống còn: tin tặc không chỉ tìm cửa sổ hở; chúng tìm cách lừa hệ thống tự mở cửa từ bên trong. SSRF chính là mánh khóe đó. Nếu ứng dụng của bạn xử lý các URL do người dùng cung cấp—cho dù là ảnh đại diện, tích hợp webhook hay trình tạo PDF—bạn đang nằm trong tầm ngắm.

Cơ chế hoạt động của SSRF

Các yêu cầu tính năng thường đòi hỏi việc lấy dữ liệu bên ngoài. Ví dụ: người dùng có thể cung cấp liên kết đến một hình ảnh từ xa. Sau đó, máy chủ của bạn sẽ thực hiện một yêu cầu GET tới URL đó.

Tuy nhiên, kẻ tấn công có thể nhập http://127.0.0.1:6379. Ngay lập tức, máy chủ của bạn sẽ dò quét instance Redis nội bộ. Trong các môi trường đám mây như AWS, kẻ tấn công có thể nhắm tới http://169.254.169.254/latest/meta-data/ để chiếm đoạt thông tin xác thực IAM. Chúng ta không bao giờ có thể tin tưởng một đích đến của yêu cầu được khởi tạo bởi chính backend nếu đầu vào bắt nguồn từ người dùng.

Xây dựng các lớp phòng thủ: Đừng chỉ dựa vào Regex

Đừng dựa vào việc khớp chuỗi đơn giản. Việc ngăn chặn đòi hỏi phải xây dựng các lớp cô lập ở cả cấp độ mạng và cấp độ ứng dụng.

Thực thi cô lập mạng

Bước đầu tiên của tôi trong bất kỳ hệ thống production nào là khóa lưu lượng truy cập ra (egress). Máy chủ web của bạn hiếm khi cần giao tiếp với mọi IP nội bộ. Bằng cách sử dụng iptables hoặc Security Groups trên đám mây, bạn có thể ngăn chặn máy chủ web tiếp cận mạng quản trị một cách vật lý. Trong một đợt kiểm tra gần đây, chúng tôi thấy rằng việc chặn dải 10.0.0.0/8 ở cấp độ tường lửa đã vô hiệu hóa 90% các nỗ lực quét nội bộ.

# Chặn người dùng www-data truy cập dịch vụ AWS Metadata
iptables -A OUTPUT -m owner --uid-owner www-data -d 169.254.169.254 -j REJECT

Gia cố HTTP Client

Các thư viện tiêu chuẩn thường mặc định đi theo các chuyển hướng (redirect). Đây là một cái bẫy lớn. Kẻ tấn công có thể cung cấp một URL trông có vẻ an toàn nhưng lại chuyển hướng đến một IP nội bộ bị hạn chế (như 192.168.1.1). Hãy sử dụng các thư viện cho phép bạn can thiệp vào vòng đời của yêu cầu. Bạn phải xác thực địa chỉ IP sau khi phân giải DNS nhưng trước khi gửi yêu cầu để ngăn chặn các cuộc tấn công DNS rebinding.

Triển khai cơ chế “Từ chối mặc định”

Các danh sách chặn (blocklist) cho localhost hoặc 127.0.0.1 rất dễ bị vượt qua bằng cách mã hóa thập phân hoặc thập lục phân. Cách tiếp cận đáng tin cậy duy nhất là sử dụng danh sách cho phép (allowlist).

Xác thực IP trong Python

Đây là cách tôi xử lý việc lấy dữ liệu từ URL. Đoạn mã này phân giải tên miền và kiểm tra IP so với các dải dành riêng trước khi bất kỳ dữ liệu nào được trao đổi.

import socket
import ipaddress
import requests

def is_safe_url(url):
    try:
        # 1. Trích xuất hostname và phân giải DNS
        host = url.split('/')[2].split(':')[0]
        ip_address = socket.gethostbyname(host)
        ip = ipaddress.ip_address(ip_address)
        
        # 2. Ngăn chặn yêu cầu đến các dải IP riêng tư hoặc loopback
        if ip.is_private or ip.is_loopback or ip.is_link_local:
            return False
            
        return True
    except Exception:
        return False

def fetch_user_content(url):
    if not is_safe_url(url):
        raise ValueError("Truy cập bị từ chối: Phát hiện đích đến không an toàn.")
    
    # Vô hiệu hóa chuyển hướng để chặn các hành vi vượt qua dựa trên mã 302
    return requests.get(url, allow_redirects=False, timeout=5)

Nâng cấp lên AWS IMDSv2

Nếu bạn đang sử dụng EC2, hãy chuyển sang IMDSv2 ngay lập tức. Khác với phiên bản cũ, IMDSv2 yêu cầu một session token thông qua yêu cầu PUT. Vì hầu hết các lỗi SSRF chỉ cho phép yêu cầu GET, thay đổi duy nhất này khiến kẻ tấn công gần như không thể đánh cắp metadata của instance.

# Yêu cầu token để truy cập metadata trên một instance cụ thể
aws ec2 modify-instance-metadata-options \
    --instance-id i-0abcdef1234567890 \
    --http-tokens required \
    --http-endpoint enabled

Xác minh liên tục: Kiểm tra các rào chắn bảo vệ của bạn

Bảo mật không phải là công việc “thiết lập rồi để đó”. Bạn cần chứng minh rằng các biện pháp phòng thủ của mình thực sự hiệu quả.

Giả lập tấn công

Hãy khởi động Burp Suite hoặc OWASP ZAP. Thử lấy dữ liệu từ http://localhost:80 hoặc dò quét các dịch vụ nội bộ như Elasticsearch trên cổng 9200. Nếu ứng dụng của bạn trả về bất cứ thứ gì khác ngoài một lỗi chung chung, logic của bạn đang bị rò rỉ. Tôi cũng sử dụng interact.sh để theo dõi xem máy chủ có đang thực hiện các cuộc gọi ra ngoài không được phép trong quá trình thử nghiệm hay không.

Giám sát lưu lượng dữ liệu ra (Egress Traffic)

Nhật ký (log) chính là mắt và tai của bạn. Hãy giám sát các yêu cầu ra ngoài để tìm các cuộc gọi được thực hiện trực tiếp tới địa chỉ IP thay vì tên miền. Số lượng lớn phản hồi 403 Forbidden từ các dải mạng nội bộ là một dấu hiệu cảnh báo lớn—chúng thường báo hiệu một kẻ tấn công đang thực hiện quét cổng tự động. Các công cụ như Falco thậm chí có thể cảnh báo bạn ngay khi một tiến trình web cố gắng chạm vào dịch vụ metadata hoặc một cổng cơ sở dữ liệu nhạy cảm.

Hãy coi đầu vào của người dùng là độc hại. Bằng cách kết hợp các bức tường ở cấp độ mạng, xác thực mã nghiêm ngặt và giám sát liên tục, bạn sẽ biến nguy cơ SSRF nghiêm trọng thành một vấn đề không đáng ngại. Hãy bắt đầu từ mạng lưới, gia cố mã nguồn và không bao giờ ngừng thử nghiệm.