Compare commits
3 commits
f40c4a6ea0
...
9297ba4e0c
Author | SHA1 | Date | |
---|---|---|---|
9297ba4e0c |
|||
66993ebdec |
|||
37e57fa015 |
6 changed files with 1544 additions and 1414 deletions
551
src/config.rs
Normal file
551
src/config.rs
Normal file
|
@ -0,0 +1,551 @@
|
||||||
|
use clap::Parser;
|
||||||
|
use ipnetwork::IpNetwork;
|
||||||
|
use regex::Regex;
|
||||||
|
use serde::{Deserialize, Serialize};
|
||||||
|
use std::env;
|
||||||
|
use std::fs;
|
||||||
|
use std::net::IpAddr;
|
||||||
|
use std::path::{Path, PathBuf};
|
||||||
|
|
||||||
|
// Command-line arguments using clap
|
||||||
|
#[derive(Parser, Debug, Clone)]
|
||||||
|
#[clap(
|
||||||
|
author,
|
||||||
|
version,
|
||||||
|
about = "Markov chain based HTTP tarpit/honeypot that delays and tracks potential attackers"
|
||||||
|
)]
|
||||||
|
pub struct Args {
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "0.0.0.0:8888",
|
||||||
|
help = "Address and port to listen for incoming HTTP requests (format: ip:port)"
|
||||||
|
)]
|
||||||
|
pub listen_addr: String,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "0.0.0.0:9100",
|
||||||
|
help = "Address and port to expose Prometheus metrics and status endpoint (format: ip:port)"
|
||||||
|
)]
|
||||||
|
pub metrics_addr: String,
|
||||||
|
|
||||||
|
#[clap(long, help = "Disable Prometheus metrics server completely")]
|
||||||
|
pub disable_metrics: bool,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "127.0.0.1:80",
|
||||||
|
help = "Backend server address to proxy legitimate requests to (format: ip:port)"
|
||||||
|
)]
|
||||||
|
pub backend_addr: String,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "1000",
|
||||||
|
help = "Minimum delay in milliseconds between chunks sent to attacker"
|
||||||
|
)]
|
||||||
|
pub min_delay: u64,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "15000",
|
||||||
|
help = "Maximum delay in milliseconds between chunks sent to attacker"
|
||||||
|
)]
|
||||||
|
pub max_delay: u64,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "600",
|
||||||
|
help = "Maximum time in seconds to keep an attacker in the tarpit before disconnecting"
|
||||||
|
)]
|
||||||
|
pub max_tarpit_time: u64,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "3",
|
||||||
|
help = "Number of hits to honeypot patterns before permanently blocking an IP"
|
||||||
|
)]
|
||||||
|
pub block_threshold: u32,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
help = "Base directory for all application data (overrides XDG directory structure)"
|
||||||
|
)]
|
||||||
|
pub base_dir: Option<PathBuf>,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
help = "Path to configuration file (JSON or TOML, overrides command line options)"
|
||||||
|
)]
|
||||||
|
pub config_file: Option<PathBuf>,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "info",
|
||||||
|
help = "Log level: trace, debug, info, warn, error"
|
||||||
|
)]
|
||||||
|
pub log_level: String,
|
||||||
|
|
||||||
|
#[clap(
|
||||||
|
long,
|
||||||
|
default_value = "pretty",
|
||||||
|
help = "Log format: plain, pretty, json, pretty-json"
|
||||||
|
)]
|
||||||
|
pub log_format: String,
|
||||||
|
}
|
||||||
|
|
||||||
|
#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Default)]
|
||||||
|
pub enum LogFormat {
|
||||||
|
Plain,
|
||||||
|
#[default]
|
||||||
|
Pretty,
|
||||||
|
Json,
|
||||||
|
PrettyJson,
|
||||||
|
}
|
||||||
|
|
||||||
|
// Trap pattern structure. It can be either a plain string
|
||||||
|
// regex to catch more advanced patterns necessitated by
|
||||||
|
// more sophisticated crawlers.
|
||||||
|
#[derive(Clone, Debug, Deserialize, Serialize)]
|
||||||
|
#[serde(untagged)]
|
||||||
|
pub enum TrapPattern {
|
||||||
|
Plain(String),
|
||||||
|
Regex { pattern: String, regex: bool },
|
||||||
|
}
|
||||||
|
|
||||||
|
impl TrapPattern {
|
||||||
|
pub fn as_plain(value: &str) -> Self {
|
||||||
|
Self::Plain(value.to_string())
|
||||||
|
}
|
||||||
|
|
||||||
|
pub fn as_regex(value: &str) -> Self {
|
||||||
|
Self::Regex {
|
||||||
|
pattern: value.to_string(),
|
||||||
|
regex: true,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
pub fn matches(&self, path: &str) -> bool {
|
||||||
|
match self {
|
||||||
|
Self::Plain(pattern) => path.contains(pattern),
|
||||||
|
Self::Regex {
|
||||||
|
pattern,
|
||||||
|
regex: true,
|
||||||
|
} => {
|
||||||
|
if let Ok(re) = Regex::new(pattern) {
|
||||||
|
re.is_match(path)
|
||||||
|
} else {
|
||||||
|
false
|
||||||
|
}
|
||||||
|
}
|
||||||
|
_ => false,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Configuration structure
|
||||||
|
#[derive(Clone, Debug, Deserialize, Serialize)]
|
||||||
|
pub struct Config {
|
||||||
|
pub listen_addr: String,
|
||||||
|
pub metrics_addr: String,
|
||||||
|
pub disable_metrics: bool,
|
||||||
|
pub backend_addr: String,
|
||||||
|
pub min_delay: u64,
|
||||||
|
pub max_delay: u64,
|
||||||
|
pub max_tarpit_time: u64,
|
||||||
|
pub block_threshold: u32,
|
||||||
|
pub trap_patterns: Vec<TrapPattern>,
|
||||||
|
pub whitelist_networks: Vec<String>,
|
||||||
|
pub markov_corpora_dir: String,
|
||||||
|
pub lua_scripts_dir: String,
|
||||||
|
pub data_dir: String,
|
||||||
|
pub config_dir: String,
|
||||||
|
pub cache_dir: String,
|
||||||
|
pub log_format: LogFormat,
|
||||||
|
}
|
||||||
|
|
||||||
|
impl Default for Config {
|
||||||
|
fn default() -> Self {
|
||||||
|
Self {
|
||||||
|
listen_addr: "0.0.0.0:8888".to_string(),
|
||||||
|
metrics_addr: "0.0.0.0:9100".to_string(),
|
||||||
|
disable_metrics: false,
|
||||||
|
backend_addr: "127.0.0.1:80".to_string(),
|
||||||
|
min_delay: 1000,
|
||||||
|
max_delay: 15000,
|
||||||
|
max_tarpit_time: 600,
|
||||||
|
block_threshold: 3,
|
||||||
|
trap_patterns: vec![
|
||||||
|
// Basic attack patterns as plain strings
|
||||||
|
TrapPattern::as_plain("/vendor/phpunit"),
|
||||||
|
TrapPattern::as_plain("eval-stdin.php"),
|
||||||
|
TrapPattern::as_plain("/wp-admin"),
|
||||||
|
TrapPattern::as_plain("/wp-login.php"),
|
||||||
|
TrapPattern::as_plain("/xmlrpc.php"),
|
||||||
|
TrapPattern::as_plain("/phpMyAdmin"),
|
||||||
|
TrapPattern::as_plain("/solr/"),
|
||||||
|
TrapPattern::as_plain("/.env"),
|
||||||
|
TrapPattern::as_plain("/config"),
|
||||||
|
TrapPattern::as_plain("/actuator/"),
|
||||||
|
// More aggressive patterns for various PHP exploits.
|
||||||
|
// XXX: I dedicate this entire section to that one single crawler
|
||||||
|
// that has been scanning my entire network, hitting 403s left and right
|
||||||
|
// but not giving up, and coming back the next day at the same time to
|
||||||
|
// scan the same paths over and over. Kudos to you, random crawler.
|
||||||
|
TrapPattern::as_regex(r"/.*phpunit.*eval-stdin\.php"),
|
||||||
|
TrapPattern::as_regex(r"/index\.php\?s=/index/\\think\\app/invokefunction"),
|
||||||
|
TrapPattern::as_regex(r".*%ADd\+auto_prepend_file%3dphp://input.*"),
|
||||||
|
TrapPattern::as_regex(r".*%ADd\+allow_url_include%3d1.*"),
|
||||||
|
TrapPattern::as_regex(r".*/wp-content/plugins/.*\.php"),
|
||||||
|
TrapPattern::as_regex(r".*/wp-content/themes/.*\.php"),
|
||||||
|
TrapPattern::as_regex(r".*eval\(.*\).*"),
|
||||||
|
TrapPattern::as_regex(r".*/adminer\.php.*"),
|
||||||
|
TrapPattern::as_regex(r".*/admin\.php.*"),
|
||||||
|
TrapPattern::as_regex(r".*/administrator/.*"),
|
||||||
|
TrapPattern::as_regex(r".*/wp-json/.*"),
|
||||||
|
TrapPattern::as_regex(r".*/api/.*\.php.*"),
|
||||||
|
TrapPattern::as_regex(r".*/cgi-bin/.*"),
|
||||||
|
TrapPattern::as_regex(r".*/owa/.*"),
|
||||||
|
TrapPattern::as_regex(r".*/ecp/.*"),
|
||||||
|
TrapPattern::as_regex(r".*/webshell\.php.*"),
|
||||||
|
TrapPattern::as_regex(r".*/shell\.php.*"),
|
||||||
|
TrapPattern::as_regex(r".*/cmd\.php.*"),
|
||||||
|
TrapPattern::as_regex(r".*/struts.*"),
|
||||||
|
],
|
||||||
|
whitelist_networks: vec![
|
||||||
|
"192.168.0.0/16".to_string(),
|
||||||
|
"10.0.0.0/8".to_string(),
|
||||||
|
"172.16.0.0/12".to_string(),
|
||||||
|
"127.0.0.0/8".to_string(),
|
||||||
|
],
|
||||||
|
markov_corpora_dir: "./corpora".to_string(),
|
||||||
|
lua_scripts_dir: "./scripts".to_string(),
|
||||||
|
data_dir: "./data".to_string(),
|
||||||
|
config_dir: "./conf".to_string(),
|
||||||
|
cache_dir: "./cache".to_string(),
|
||||||
|
log_format: LogFormat::Pretty,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Gets standard XDG directory paths for config, data and cache.
|
||||||
|
// XXX: This could be "simplified" by using the Dirs crate, but I can't
|
||||||
|
// really justify pulling a library for something I can handle in less
|
||||||
|
// than 30 lines. Unless cross-platform becomes necessary, the below
|
||||||
|
// implementation is good enough. For alternative platforms, we can simply
|
||||||
|
// enhance the current implementation as needed.
|
||||||
|
pub fn get_xdg_dirs() -> (PathBuf, PathBuf, PathBuf) {
|
||||||
|
let config_home = env::var_os("XDG_CONFIG_HOME")
|
||||||
|
.map(PathBuf::from)
|
||||||
|
.unwrap_or_else(|| {
|
||||||
|
let home = env::var_os("HOME").map_or_else(|| PathBuf::from("."), PathBuf::from);
|
||||||
|
home.join(".config")
|
||||||
|
});
|
||||||
|
|
||||||
|
let data_home = env::var_os("XDG_DATA_HOME")
|
||||||
|
.map(PathBuf::from)
|
||||||
|
.unwrap_or_else(|| {
|
||||||
|
let home = env::var_os("HOME").map_or_else(|| PathBuf::from("."), PathBuf::from);
|
||||||
|
home.join(".local").join("share")
|
||||||
|
});
|
||||||
|
|
||||||
|
let cache_home = env::var_os("XDG_CACHE_HOME")
|
||||||
|
.map(PathBuf::from)
|
||||||
|
.unwrap_or_else(|| {
|
||||||
|
let home = env::var_os("HOME").map_or_else(|| PathBuf::from("."), PathBuf::from);
|
||||||
|
home.join(".cache")
|
||||||
|
});
|
||||||
|
|
||||||
|
let config_dir = config_home.join("eris");
|
||||||
|
let data_dir = data_home.join("eris");
|
||||||
|
let cache_dir = cache_home.join("eris");
|
||||||
|
|
||||||
|
(config_dir, data_dir, cache_dir)
|
||||||
|
}
|
||||||
|
|
||||||
|
impl Config {
|
||||||
|
// Create configuration from command-line args. We'll be falling back to this
|
||||||
|
// when the configuration is invalid, so it must be validated more strictly.
|
||||||
|
pub fn from_args(args: &Args) -> Self {
|
||||||
|
let (config_dir, data_dir, cache_dir) = if let Some(base_dir) = &args.base_dir {
|
||||||
|
let base_str = base_dir.to_string_lossy().to_string();
|
||||||
|
(
|
||||||
|
format!("{base_str}/conf"),
|
||||||
|
format!("{base_str}/data"),
|
||||||
|
format!("{base_str}/cache"),
|
||||||
|
)
|
||||||
|
} else {
|
||||||
|
let (c, d, cache) = get_xdg_dirs();
|
||||||
|
(
|
||||||
|
c.to_string_lossy().to_string(),
|
||||||
|
d.to_string_lossy().to_string(),
|
||||||
|
cache.to_string_lossy().to_string(),
|
||||||
|
)
|
||||||
|
};
|
||||||
|
|
||||||
|
Self {
|
||||||
|
listen_addr: args.listen_addr.clone(),
|
||||||
|
metrics_addr: args.metrics_addr.clone(),
|
||||||
|
disable_metrics: args.disable_metrics,
|
||||||
|
backend_addr: args.backend_addr.clone(),
|
||||||
|
min_delay: args.min_delay,
|
||||||
|
max_delay: args.max_delay,
|
||||||
|
max_tarpit_time: args.max_tarpit_time,
|
||||||
|
block_threshold: args.block_threshold,
|
||||||
|
markov_corpora_dir: format!("{data_dir}/corpora"),
|
||||||
|
lua_scripts_dir: format!("{data_dir}/scripts"),
|
||||||
|
data_dir,
|
||||||
|
config_dir,
|
||||||
|
cache_dir,
|
||||||
|
..Default::default()
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Load configuration from a file (JSON or TOML)
|
||||||
|
pub fn load_from_file(path: &Path) -> std::io::Result<Self> {
|
||||||
|
let content = fs::read_to_string(path)?;
|
||||||
|
|
||||||
|
let extension = path
|
||||||
|
.extension()
|
||||||
|
.map(|ext| ext.to_string_lossy().to_lowercase())
|
||||||
|
.unwrap_or_default();
|
||||||
|
|
||||||
|
let config = match extension.as_str() {
|
||||||
|
"toml" => toml::from_str(&content).map_err(|e| {
|
||||||
|
std::io::Error::new(
|
||||||
|
std::io::ErrorKind::InvalidData,
|
||||||
|
format!("Failed to parse TOML: {e}"),
|
||||||
|
)
|
||||||
|
})?,
|
||||||
|
_ => {
|
||||||
|
// Default to JSON for any other extension
|
||||||
|
serde_json::from_str(&content).map_err(|e| {
|
||||||
|
std::io::Error::new(
|
||||||
|
std::io::ErrorKind::InvalidData,
|
||||||
|
format!("Failed to parse JSON: {e}"),
|
||||||
|
)
|
||||||
|
})?
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
Ok(config)
|
||||||
|
}
|
||||||
|
|
||||||
|
// Save configuration to a file (JSON or TOML)
|
||||||
|
pub fn save_to_file(&self, path: &Path) -> std::io::Result<()> {
|
||||||
|
if let Some(parent) = path.parent() {
|
||||||
|
fs::create_dir_all(parent)?;
|
||||||
|
}
|
||||||
|
|
||||||
|
let extension = path
|
||||||
|
.extension()
|
||||||
|
.map(|ext| ext.to_string_lossy().to_lowercase())
|
||||||
|
.unwrap_or_default();
|
||||||
|
|
||||||
|
let content = match extension.as_str() {
|
||||||
|
"toml" => toml::to_string_pretty(self).map_err(|e| {
|
||||||
|
std::io::Error::new(
|
||||||
|
std::io::ErrorKind::InvalidData,
|
||||||
|
format!("Failed to serialize to TOML: {e}"),
|
||||||
|
)
|
||||||
|
})?,
|
||||||
|
_ => {
|
||||||
|
// Default to JSON for any other extension
|
||||||
|
serde_json::to_string_pretty(self).map_err(|e| {
|
||||||
|
std::io::Error::new(
|
||||||
|
std::io::ErrorKind::InvalidData,
|
||||||
|
format!("Failed to serialize to JSON: {e}"),
|
||||||
|
)
|
||||||
|
})?
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
fs::write(path, content)?;
|
||||||
|
Ok(())
|
||||||
|
}
|
||||||
|
|
||||||
|
// Create required directories if they don't exist
|
||||||
|
pub fn ensure_dirs_exist(&self) -> std::io::Result<()> {
|
||||||
|
let dirs = [
|
||||||
|
&self.markov_corpora_dir,
|
||||||
|
&self.lua_scripts_dir,
|
||||||
|
&self.data_dir,
|
||||||
|
&self.config_dir,
|
||||||
|
&self.cache_dir,
|
||||||
|
];
|
||||||
|
|
||||||
|
for dir in dirs {
|
||||||
|
fs::create_dir_all(dir)?;
|
||||||
|
log::debug!("Created directory: {dir}");
|
||||||
|
}
|
||||||
|
|
||||||
|
Ok(())
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Decide if a request should be tarpitted based on path and IP
|
||||||
|
pub fn should_tarpit(path: &str, ip: &IpAddr, config: &Config) -> bool {
|
||||||
|
// Check whitelist IPs first to avoid unnecessary pattern matching
|
||||||
|
for network_str in &config.whitelist_networks {
|
||||||
|
if let Ok(network) = network_str.parse::<IpNetwork>() {
|
||||||
|
if network.contains(*ip) {
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Use pattern matching based on the trap pattern type. It can be
|
||||||
|
// a plain string or regex.
|
||||||
|
for pattern in &config.trap_patterns {
|
||||||
|
if pattern.matches(path) {
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
false
|
||||||
|
}
|
||||||
|
|
||||||
|
#[cfg(test)]
|
||||||
|
mod tests {
|
||||||
|
use super::*;
|
||||||
|
use std::net::{IpAddr, Ipv4Addr};
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_config_from_args() {
|
||||||
|
let args = Args {
|
||||||
|
listen_addr: "127.0.0.1:8080".to_string(),
|
||||||
|
metrics_addr: "127.0.0.1:9000".to_string(),
|
||||||
|
disable_metrics: true,
|
||||||
|
backend_addr: "127.0.0.1:8081".to_string(),
|
||||||
|
min_delay: 500,
|
||||||
|
max_delay: 10000,
|
||||||
|
max_tarpit_time: 300,
|
||||||
|
block_threshold: 5,
|
||||||
|
base_dir: Some(PathBuf::from("/tmp/eris")),
|
||||||
|
config_file: None,
|
||||||
|
log_level: "debug".to_string(),
|
||||||
|
log_format: "pretty".to_string(),
|
||||||
|
};
|
||||||
|
|
||||||
|
let config = Config::from_args(&args);
|
||||||
|
assert_eq!(config.listen_addr, "127.0.0.1:8080");
|
||||||
|
assert_eq!(config.metrics_addr, "127.0.0.1:9000");
|
||||||
|
assert!(config.disable_metrics);
|
||||||
|
assert_eq!(config.backend_addr, "127.0.0.1:8081");
|
||||||
|
assert_eq!(config.min_delay, 500);
|
||||||
|
assert_eq!(config.max_delay, 10000);
|
||||||
|
assert_eq!(config.max_tarpit_time, 300);
|
||||||
|
assert_eq!(config.block_threshold, 5);
|
||||||
|
assert_eq!(config.markov_corpora_dir, "/tmp/eris/data/corpora");
|
||||||
|
assert_eq!(config.lua_scripts_dir, "/tmp/eris/data/scripts");
|
||||||
|
assert_eq!(config.data_dir, "/tmp/eris/data");
|
||||||
|
assert_eq!(config.config_dir, "/tmp/eris/conf");
|
||||||
|
assert_eq!(config.cache_dir, "/tmp/eris/cache");
|
||||||
|
}
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_trap_pattern_matching() {
|
||||||
|
// Test plain string pattern
|
||||||
|
let plain = TrapPattern::as_plain("phpunit");
|
||||||
|
assert!(plain.matches("path/to/phpunit/test"));
|
||||||
|
assert!(!plain.matches("path/to/something/else"));
|
||||||
|
|
||||||
|
// Test regex pattern
|
||||||
|
let regex = TrapPattern::as_regex(r".*eval-stdin\.php.*");
|
||||||
|
assert!(regex.matches("/vendor/phpunit/phpunit/src/Util/PHP/eval-stdin.php"));
|
||||||
|
assert!(regex.matches("/tests/eval-stdin.php?param"));
|
||||||
|
assert!(!regex.matches("/normal/path"));
|
||||||
|
|
||||||
|
// Test invalid regex pattern (should return false)
|
||||||
|
let invalid = TrapPattern::Regex {
|
||||||
|
pattern: "(invalid[regex".to_string(),
|
||||||
|
regex: true,
|
||||||
|
};
|
||||||
|
assert!(!invalid.matches("anything"));
|
||||||
|
}
|
||||||
|
|
||||||
|
#[tokio::test]
|
||||||
|
async fn test_should_tarpit() {
|
||||||
|
let config = Config::default();
|
||||||
|
|
||||||
|
// Test trap patterns
|
||||||
|
assert!(should_tarpit(
|
||||||
|
"/vendor/phpunit/whatever",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
assert!(should_tarpit(
|
||||||
|
"/wp-admin/login.php",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
assert!(should_tarpit(
|
||||||
|
"/.env",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
|
||||||
|
// Test whitelist networks
|
||||||
|
assert!(!should_tarpit(
|
||||||
|
"/wp-admin/login.php",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(127, 0, 0, 1)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
assert!(!should_tarpit(
|
||||||
|
"/vendor/phpunit/whatever",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(192, 168, 1, 1)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
|
||||||
|
// Test legitimate paths
|
||||||
|
assert!(!should_tarpit(
|
||||||
|
"/index.html",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
assert!(!should_tarpit(
|
||||||
|
"/images/logo.png",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
|
||||||
|
// Test regex patterns
|
||||||
|
assert!(should_tarpit(
|
||||||
|
"/index.php?s=/index/\\think\\app/invokefunction&function=call_user_func_array&vars[0]=md5&vars[1][]=Hello",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
|
||||||
|
assert!(should_tarpit(
|
||||||
|
"/hello.world?%ADd+allow_url_include%3d1+%ADd+auto_prepend_file%3dphp://input",
|
||||||
|
&IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4)),
|
||||||
|
&config
|
||||||
|
));
|
||||||
|
}
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_config_file_formats() {
|
||||||
|
// Create temporary JSON config file
|
||||||
|
let temp_dir = std::env::temp_dir();
|
||||||
|
let json_path = temp_dir.join("temp_config.json");
|
||||||
|
let toml_path = temp_dir.join("temp_config.toml");
|
||||||
|
|
||||||
|
let config = Config::default();
|
||||||
|
|
||||||
|
// Test JSON serialization and deserialization
|
||||||
|
config.save_to_file(&json_path).unwrap();
|
||||||
|
let loaded_json = Config::load_from_file(&json_path).unwrap();
|
||||||
|
assert_eq!(loaded_json.listen_addr, config.listen_addr);
|
||||||
|
assert_eq!(loaded_json.min_delay, config.min_delay);
|
||||||
|
|
||||||
|
// Test TOML serialization and deserialization
|
||||||
|
config.save_to_file(&toml_path).unwrap();
|
||||||
|
let loaded_toml = Config::load_from_file(&toml_path).unwrap();
|
||||||
|
assert_eq!(loaded_toml.listen_addr, config.listen_addr);
|
||||||
|
assert_eq!(loaded_toml.min_delay, config.min_delay);
|
||||||
|
|
||||||
|
// Clean up
|
||||||
|
let _ = std::fs::remove_file(json_path);
|
||||||
|
let _ = std::fs::remove_file(toml_path);
|
||||||
|
}
|
||||||
|
}
|
128
src/firewall.rs
Normal file
128
src/firewall.rs
Normal file
|
@ -0,0 +1,128 @@
|
||||||
|
use tokio::process::Command;
|
||||||
|
|
||||||
|
// Set up nftables firewall rules for IP blocking
|
||||||
|
pub async fn setup_firewall() -> Result<(), String> {
|
||||||
|
log::info!("Setting up firewall rules");
|
||||||
|
|
||||||
|
// Check if nft command exists
|
||||||
|
let nft_exists = Command::new("which")
|
||||||
|
.arg("nft")
|
||||||
|
.output()
|
||||||
|
.await
|
||||||
|
.map(|output| output.status.success())
|
||||||
|
.unwrap_or(false);
|
||||||
|
|
||||||
|
if !nft_exists {
|
||||||
|
log::warn!("nft command not found. Firewall rules will not be set up.");
|
||||||
|
return Ok(());
|
||||||
|
}
|
||||||
|
|
||||||
|
// Create table if it doesn't exist
|
||||||
|
let output = Command::new("nft")
|
||||||
|
.args(["list", "table", "inet", "filter"])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
match output {
|
||||||
|
Ok(output) => {
|
||||||
|
if !output.status.success() {
|
||||||
|
log::info!("Creating nftables table");
|
||||||
|
let result = Command::new("nft")
|
||||||
|
.args(["create", "table", "inet", "filter"])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
if let Err(e) = result {
|
||||||
|
return Err(format!("Failed to create nftables table: {e}"));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::warn!("Failed to check if nftables table exists: {e}");
|
||||||
|
log::info!("Will try to create it anyway");
|
||||||
|
let result = Command::new("nft")
|
||||||
|
.args(["create", "table", "inet", "filter"])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
if let Err(e) = result {
|
||||||
|
return Err(format!("Failed to create nftables table: {e}"));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Create blacklist set if it doesn't exist
|
||||||
|
let output = Command::new("nft")
|
||||||
|
.args(["list", "set", "inet", "filter", "eris_blacklist"])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
match output {
|
||||||
|
Ok(output) => {
|
||||||
|
if !output.status.success() {
|
||||||
|
log::info!("Creating eris_blacklist set");
|
||||||
|
let result = Command::new("nft")
|
||||||
|
.args([
|
||||||
|
"create",
|
||||||
|
"set",
|
||||||
|
"inet",
|
||||||
|
"filter",
|
||||||
|
"eris_blacklist",
|
||||||
|
"{ type ipv4_addr; flags interval; }",
|
||||||
|
])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
if let Err(e) = result {
|
||||||
|
return Err(format!("Failed to create blacklist set: {e}"));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::warn!("Failed to check if blacklist set exists: {e}");
|
||||||
|
return Err(format!("Failed to check if blacklist set exists: {e}"));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Add rule to drop traffic from blacklisted IPs
|
||||||
|
let output = Command::new("nft")
|
||||||
|
.args(["list", "chain", "inet", "filter", "input"])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
// Check if our rule already exists
|
||||||
|
match output {
|
||||||
|
Ok(output) => {
|
||||||
|
let rule_exists = String::from_utf8_lossy(&output.stdout)
|
||||||
|
.contains("ip saddr @eris_blacklist counter drop");
|
||||||
|
|
||||||
|
if !rule_exists {
|
||||||
|
log::info!("Adding drop rule for blacklisted IPs");
|
||||||
|
let result = Command::new("nft")
|
||||||
|
.args([
|
||||||
|
"add",
|
||||||
|
"rule",
|
||||||
|
"inet",
|
||||||
|
"filter",
|
||||||
|
"input",
|
||||||
|
"ip saddr @eris_blacklist",
|
||||||
|
"counter",
|
||||||
|
"drop",
|
||||||
|
])
|
||||||
|
.output()
|
||||||
|
.await;
|
||||||
|
|
||||||
|
if let Err(e) = result {
|
||||||
|
return Err(format!("Failed to add firewall rule: {e}"));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::warn!("Failed to check if firewall rule exists: {e}");
|
||||||
|
return Err(format!("Failed to check if firewall rule exists: {e}"));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
log::info!("Firewall setup complete");
|
||||||
|
Ok(())
|
||||||
|
}
|
1502
src/main.rs
1502
src/main.rs
File diff suppressed because it is too large
Load diff
443
src/network.rs
Normal file
443
src/network.rs
Normal file
|
@ -0,0 +1,443 @@
|
||||||
|
use std::collections::HashMap;
|
||||||
|
use std::net::IpAddr;
|
||||||
|
use std::sync::Arc;
|
||||||
|
use std::time::{Duration, Instant};
|
||||||
|
|
||||||
|
use tokio::io::{AsyncReadExt, AsyncWriteExt};
|
||||||
|
use tokio::net::TcpStream;
|
||||||
|
use tokio::process::Command;
|
||||||
|
use tokio::sync::RwLock;
|
||||||
|
use tokio::time::sleep;
|
||||||
|
|
||||||
|
use crate::config::Config;
|
||||||
|
use crate::lua::{EventContext, EventType, ScriptManager};
|
||||||
|
use crate::markov::MarkovGenerator;
|
||||||
|
use crate::metrics::{ACTIVE_CONNECTIONS, BLOCKED_IPS, HITS_COUNTER, PATH_HITS, UA_HITS};
|
||||||
|
use crate::state::BotState;
|
||||||
|
use crate::utils::{
|
||||||
|
choose_response_type, extract_all_headers, extract_header_value, extract_path_from_request,
|
||||||
|
find_header_end, generate_session_id, get_timestamp,
|
||||||
|
};
|
||||||
|
|
||||||
|
// Main connection handler.
|
||||||
|
// Decides whether to tarpit or proxy
|
||||||
|
pub async fn handle_connection(
|
||||||
|
mut stream: TcpStream,
|
||||||
|
config: Arc<Config>,
|
||||||
|
state: Arc<RwLock<BotState>>,
|
||||||
|
markov_generator: Arc<MarkovGenerator>,
|
||||||
|
script_manager: Arc<ScriptManager>,
|
||||||
|
) {
|
||||||
|
// Get peer information
|
||||||
|
let peer_addr = match stream.peer_addr() {
|
||||||
|
Ok(addr) => addr.ip(),
|
||||||
|
Err(e) => {
|
||||||
|
log::debug!("Failed to get peer address: {e}");
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
// Check for blocked IPs to avoid any processing
|
||||||
|
if state.read().await.blocked.contains(&peer_addr) {
|
||||||
|
log::debug!("Rejected connection from blocked IP: {peer_addr}");
|
||||||
|
let _ = stream.shutdown().await;
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Check if Lua scripts allow this connection
|
||||||
|
if !script_manager.on_connection(&peer_addr.to_string()) {
|
||||||
|
log::debug!("Connection rejected by Lua script: {peer_addr}");
|
||||||
|
let _ = stream.shutdown().await;
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Pre-check for whitelisted IPs to bypass heavy processing
|
||||||
|
let mut whitelisted = false;
|
||||||
|
for network_str in &config.whitelist_networks {
|
||||||
|
if let Ok(network) = network_str.parse::<ipnetwork::IpNetwork>() {
|
||||||
|
if network.contains(peer_addr) {
|
||||||
|
whitelisted = true;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Read buffer
|
||||||
|
let mut buffer = vec![0; 8192];
|
||||||
|
let mut request_data = Vec::with_capacity(8192);
|
||||||
|
let mut header_end_pos = 0;
|
||||||
|
|
||||||
|
// Read with timeout to prevent hanging resource load ops.
|
||||||
|
let read_fut = async {
|
||||||
|
loop {
|
||||||
|
match stream.read(&mut buffer).await {
|
||||||
|
Ok(0) => break,
|
||||||
|
Ok(n) => {
|
||||||
|
let new_data = &buffer[..n];
|
||||||
|
request_data.extend_from_slice(new_data);
|
||||||
|
|
||||||
|
// Look for end of headers
|
||||||
|
if header_end_pos == 0 {
|
||||||
|
if let Some(pos) = find_header_end(&request_data) {
|
||||||
|
header_end_pos = pos;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Avoid excessive buffering
|
||||||
|
if request_data.len() > 32768 {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::debug!("Error reading from stream: {e}");
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
let timeout_fut = sleep(Duration::from_secs(3));
|
||||||
|
|
||||||
|
tokio::select! {
|
||||||
|
() = read_fut => {},
|
||||||
|
() = timeout_fut => {
|
||||||
|
log::debug!("Connection timeout from: {peer_addr}");
|
||||||
|
let _ = stream.shutdown().await;
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Fast path for whitelisted IPs. Skip full parsing and speed up "approved"
|
||||||
|
// connections automatically.
|
||||||
|
if whitelisted {
|
||||||
|
log::debug!("Whitelisted IP {peer_addr} - using fast proxy path");
|
||||||
|
proxy_fast_path(stream, request_data, &config.backend_addr).await;
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Parse minimally to extract the path
|
||||||
|
let path = if let Some(p) = extract_path_from_request(&request_data) {
|
||||||
|
p
|
||||||
|
} else {
|
||||||
|
log::debug!("Invalid request from {peer_addr}");
|
||||||
|
let _ = stream.shutdown().await;
|
||||||
|
return;
|
||||||
|
};
|
||||||
|
|
||||||
|
// Extract request headers for Lua scripts
|
||||||
|
let headers = extract_all_headers(&request_data);
|
||||||
|
|
||||||
|
// Extract user agent for logging and decision making
|
||||||
|
let user_agent =
|
||||||
|
extract_header_value(&request_data, "user-agent").unwrap_or_else(|| "unknown".to_string());
|
||||||
|
|
||||||
|
// Trigger request event for Lua scripts
|
||||||
|
let request_ctx = EventContext {
|
||||||
|
event_type: EventType::Request,
|
||||||
|
ip: Some(peer_addr.to_string()),
|
||||||
|
path: Some(path.to_string()),
|
||||||
|
user_agent: Some(user_agent.clone()),
|
||||||
|
request_headers: Some(headers.clone()),
|
||||||
|
content: None,
|
||||||
|
timestamp: get_timestamp(),
|
||||||
|
session_id: Some(generate_session_id(&peer_addr.to_string(), &user_agent)),
|
||||||
|
};
|
||||||
|
script_manager.trigger_event(&request_ctx);
|
||||||
|
|
||||||
|
// Check if this request matches our tarpit patterns
|
||||||
|
let should_tarpit = crate::config::should_tarpit(path, &peer_addr, &config);
|
||||||
|
|
||||||
|
if should_tarpit {
|
||||||
|
log::info!("Tarpit triggered: {path} from {peer_addr} (UA: {user_agent})");
|
||||||
|
|
||||||
|
// Update metrics
|
||||||
|
HITS_COUNTER.inc();
|
||||||
|
PATH_HITS.with_label_values(&[path]).inc();
|
||||||
|
UA_HITS.with_label_values(&[&user_agent]).inc();
|
||||||
|
|
||||||
|
// Update state and check for blocking threshold
|
||||||
|
{
|
||||||
|
let mut state = state.write().await;
|
||||||
|
state.active_connections.insert(peer_addr);
|
||||||
|
ACTIVE_CONNECTIONS.set(state.active_connections.len() as f64);
|
||||||
|
|
||||||
|
*state.hits.entry(peer_addr).or_insert(0) += 1;
|
||||||
|
let hit_count = state.hits[&peer_addr];
|
||||||
|
|
||||||
|
// Use Lua to decide whether to block this IP
|
||||||
|
let should_block = script_manager.should_block_ip(&peer_addr.to_string(), hit_count);
|
||||||
|
|
||||||
|
// Block IPs that hit tarpits too many times
|
||||||
|
if should_block && !state.blocked.contains(&peer_addr) {
|
||||||
|
log::info!("Blocking IP {peer_addr} after {hit_count} hits");
|
||||||
|
state.blocked.insert(peer_addr);
|
||||||
|
BLOCKED_IPS.set(state.blocked.len() as f64);
|
||||||
|
state.save_to_disk();
|
||||||
|
|
||||||
|
// Do firewall blocking in background
|
||||||
|
let peer_addr_str = peer_addr.to_string();
|
||||||
|
tokio::spawn(async move {
|
||||||
|
log::debug!("Adding IP {peer_addr_str} to firewall blacklist");
|
||||||
|
match Command::new("nft")
|
||||||
|
.args([
|
||||||
|
"add",
|
||||||
|
"element",
|
||||||
|
"inet",
|
||||||
|
"filter",
|
||||||
|
"eris_blacklist",
|
||||||
|
"{",
|
||||||
|
&peer_addr_str,
|
||||||
|
"}",
|
||||||
|
])
|
||||||
|
.output()
|
||||||
|
.await
|
||||||
|
{
|
||||||
|
Ok(output) => {
|
||||||
|
if !output.status.success() {
|
||||||
|
log::warn!(
|
||||||
|
"Failed to add IP {} to firewall: {}",
|
||||||
|
peer_addr_str,
|
||||||
|
String::from_utf8_lossy(&output.stderr)
|
||||||
|
);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::warn!("Failed to execute nft command: {e}");
|
||||||
|
}
|
||||||
|
}
|
||||||
|
});
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Generate a deceptive response using Markov chains and Lua
|
||||||
|
let response = generate_deceptive_response(
|
||||||
|
path,
|
||||||
|
&user_agent,
|
||||||
|
&peer_addr,
|
||||||
|
&headers,
|
||||||
|
&markov_generator,
|
||||||
|
&script_manager,
|
||||||
|
)
|
||||||
|
.await;
|
||||||
|
|
||||||
|
// Generate a session ID for tracking this tarpit session
|
||||||
|
let session_id = generate_session_id(&peer_addr.to_string(), &user_agent);
|
||||||
|
|
||||||
|
// Send the response with the tarpit delay strategy
|
||||||
|
{
|
||||||
|
let mut stream = stream;
|
||||||
|
let peer_addr = peer_addr;
|
||||||
|
let state = state.clone();
|
||||||
|
let min_delay = config.min_delay;
|
||||||
|
let max_delay = config.max_delay;
|
||||||
|
let max_tarpit_time = config.max_tarpit_time;
|
||||||
|
let script_manager = script_manager.clone();
|
||||||
|
async move {
|
||||||
|
let start_time = Instant::now();
|
||||||
|
let mut chars = response.chars().collect::<Vec<_>>();
|
||||||
|
for i in (0..chars.len()).rev() {
|
||||||
|
if i > 0 && rand::random::<f32>() < 0.1 {
|
||||||
|
chars.swap(i, i - 1);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
log::debug!(
|
||||||
|
"Starting tarpit for {} with {} chars, min_delay={}ms, max_delay={}ms",
|
||||||
|
peer_addr,
|
||||||
|
chars.len(),
|
||||||
|
min_delay,
|
||||||
|
max_delay
|
||||||
|
);
|
||||||
|
let mut position = 0;
|
||||||
|
let mut chunks_sent = 0;
|
||||||
|
let mut total_delay = 0;
|
||||||
|
while position < chars.len() {
|
||||||
|
// Check if we've exceeded maximum tarpit time
|
||||||
|
let elapsed_secs = start_time.elapsed().as_secs();
|
||||||
|
if elapsed_secs > max_tarpit_time {
|
||||||
|
log::info!(
|
||||||
|
"Tarpit maximum time ({max_tarpit_time} sec) reached for {peer_addr}"
|
||||||
|
);
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Decide how many chars to send in this chunk (usually 1, sometimes more)
|
||||||
|
let chunk_size = if rand::random::<f32>() < 0.9 {
|
||||||
|
1
|
||||||
|
} else {
|
||||||
|
(rand::random::<f32>() * 3.0).floor() as usize + 1
|
||||||
|
};
|
||||||
|
|
||||||
|
let end = (position + chunk_size).min(chars.len());
|
||||||
|
let chunk: String = chars[position..end].iter().collect();
|
||||||
|
|
||||||
|
// Process chunk through Lua before sending
|
||||||
|
let processed_chunk =
|
||||||
|
script_manager.process_chunk(&chunk, &peer_addr.to_string(), &session_id);
|
||||||
|
|
||||||
|
// Try to write processed chunk
|
||||||
|
if stream.write_all(processed_chunk.as_bytes()).await.is_err() {
|
||||||
|
log::debug!("Connection closed by client during tarpit: {peer_addr}");
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
if stream.flush().await.is_err() {
|
||||||
|
log::debug!("Failed to flush stream during tarpit: {peer_addr}");
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
position = end;
|
||||||
|
chunks_sent += 1;
|
||||||
|
|
||||||
|
// Apply random delay between min and max configured values
|
||||||
|
let delay_ms =
|
||||||
|
(rand::random::<f32>() * (max_delay - min_delay) as f32) as u64 + min_delay;
|
||||||
|
total_delay += delay_ms;
|
||||||
|
sleep(Duration::from_millis(delay_ms)).await;
|
||||||
|
}
|
||||||
|
log::debug!(
|
||||||
|
"Tarpit stats for {}: sent {} chunks, {}% of data, total delay {}ms over {}s",
|
||||||
|
peer_addr,
|
||||||
|
chunks_sent,
|
||||||
|
position * 100 / chars.len(),
|
||||||
|
total_delay,
|
||||||
|
start_time.elapsed().as_secs()
|
||||||
|
);
|
||||||
|
let disconnection_ctx = EventContext {
|
||||||
|
event_type: EventType::Disconnection,
|
||||||
|
ip: Some(peer_addr.to_string()),
|
||||||
|
path: None,
|
||||||
|
user_agent: None,
|
||||||
|
request_headers: None,
|
||||||
|
content: None,
|
||||||
|
timestamp: get_timestamp(),
|
||||||
|
session_id: Some(session_id),
|
||||||
|
};
|
||||||
|
script_manager.trigger_event(&disconnection_ctx);
|
||||||
|
if let Ok(mut state) = state.try_write() {
|
||||||
|
state.active_connections.remove(&peer_addr);
|
||||||
|
ACTIVE_CONNECTIONS.set(state.active_connections.len() as f64);
|
||||||
|
}
|
||||||
|
let _ = stream.shutdown().await;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
.await;
|
||||||
|
} else {
|
||||||
|
log::debug!("Proxying request: {path} from {peer_addr}");
|
||||||
|
proxy_fast_path(stream, request_data, &config.backend_addr).await;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Forward a legitimate request to the real backend server
|
||||||
|
pub async fn proxy_fast_path(
|
||||||
|
mut client_stream: TcpStream,
|
||||||
|
request_data: Vec<u8>,
|
||||||
|
backend_addr: &str,
|
||||||
|
) {
|
||||||
|
// Connect to backend server
|
||||||
|
let server_stream = match TcpStream::connect(backend_addr).await {
|
||||||
|
Ok(stream) => stream,
|
||||||
|
Err(e) => {
|
||||||
|
log::warn!("Failed to connect to backend {backend_addr}: {e}");
|
||||||
|
let _ = client_stream.shutdown().await;
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
// Set TCP_NODELAY for both streams before splitting them
|
||||||
|
if let Err(e) = client_stream.set_nodelay(true) {
|
||||||
|
log::debug!("Failed to set TCP_NODELAY on client stream: {e}");
|
||||||
|
}
|
||||||
|
|
||||||
|
let mut server_stream = server_stream;
|
||||||
|
if let Err(e) = server_stream.set_nodelay(true) {
|
||||||
|
log::debug!("Failed to set TCP_NODELAY on server stream: {e}");
|
||||||
|
}
|
||||||
|
|
||||||
|
// Forward the original request bytes directly without parsing
|
||||||
|
if server_stream.write_all(&request_data).await.is_err() {
|
||||||
|
log::debug!("Failed to write request to backend server");
|
||||||
|
let _ = client_stream.shutdown().await;
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Now split the streams for concurrent reading/writing
|
||||||
|
let (mut client_read, mut client_write) = client_stream.split();
|
||||||
|
let (mut server_read, mut server_write) = server_stream.split();
|
||||||
|
|
||||||
|
// 32KB buffer
|
||||||
|
let buf_size = 32768;
|
||||||
|
|
||||||
|
// Client -> Server
|
||||||
|
let client_to_server = async {
|
||||||
|
let mut buf = vec![0; buf_size];
|
||||||
|
let mut bytes_forwarded = 0;
|
||||||
|
|
||||||
|
loop {
|
||||||
|
match client_read.read(&mut buf).await {
|
||||||
|
Ok(0) => break,
|
||||||
|
Ok(n) => {
|
||||||
|
bytes_forwarded += n;
|
||||||
|
if server_write.write_all(&buf[..n]).await.is_err() {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(_) => break,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Ensure everything is sent
|
||||||
|
let _ = server_write.flush().await;
|
||||||
|
log::debug!("Client -> Server: forwarded {bytes_forwarded} bytes");
|
||||||
|
};
|
||||||
|
|
||||||
|
// Server -> Client
|
||||||
|
let server_to_client = async {
|
||||||
|
let mut buf = vec![0; buf_size];
|
||||||
|
let mut bytes_forwarded = 0;
|
||||||
|
|
||||||
|
loop {
|
||||||
|
match server_read.read(&mut buf).await {
|
||||||
|
Ok(0) => break,
|
||||||
|
Ok(n) => {
|
||||||
|
bytes_forwarded += n;
|
||||||
|
if client_write.write_all(&buf[..n]).await.is_err() {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(_) => break,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Ensure everything is sent
|
||||||
|
let _ = client_write.flush().await;
|
||||||
|
log::debug!("Server -> Client: forwarded {bytes_forwarded} bytes");
|
||||||
|
};
|
||||||
|
|
||||||
|
// Run both directions concurrently
|
||||||
|
tokio::join!(client_to_server, server_to_client);
|
||||||
|
log::debug!("Fast proxy connection completed");
|
||||||
|
}
|
||||||
|
|
||||||
|
// Generate a deceptive HTTP response that appears legitimate
|
||||||
|
pub async fn generate_deceptive_response(
|
||||||
|
path: &str,
|
||||||
|
user_agent: &str,
|
||||||
|
peer_addr: &IpAddr,
|
||||||
|
headers: &HashMap<String, String>,
|
||||||
|
markov: &MarkovGenerator,
|
||||||
|
script_manager: &ScriptManager,
|
||||||
|
) -> String {
|
||||||
|
// Generate base response using Markov chain text generator
|
||||||
|
let response_type = choose_response_type(path);
|
||||||
|
let markov_text = markov.generate(response_type, 30);
|
||||||
|
|
||||||
|
// Use Lua scripts to enhance with honeytokens and other deceptive content
|
||||||
|
script_manager.generate_response(
|
||||||
|
path,
|
||||||
|
user_agent,
|
||||||
|
&peer_addr.to_string(),
|
||||||
|
headers,
|
||||||
|
&markov_text,
|
||||||
|
)
|
||||||
|
}
|
166
src/state.rs
Normal file
166
src/state.rs
Normal file
|
@ -0,0 +1,166 @@
|
||||||
|
use std::collections::{HashMap, HashSet};
|
||||||
|
use std::fs;
|
||||||
|
use std::io::Write;
|
||||||
|
use std::net::IpAddr;
|
||||||
|
|
||||||
|
use crate::metrics::BLOCKED_IPS;
|
||||||
|
|
||||||
|
// State of bots/IPs hitting the honeypot
|
||||||
|
#[derive(Clone, Debug)]
|
||||||
|
pub struct BotState {
|
||||||
|
pub hits: HashMap<IpAddr, u32>,
|
||||||
|
pub blocked: HashSet<IpAddr>,
|
||||||
|
pub active_connections: HashSet<IpAddr>,
|
||||||
|
pub data_dir: String,
|
||||||
|
pub cache_dir: String,
|
||||||
|
}
|
||||||
|
|
||||||
|
impl BotState {
|
||||||
|
pub fn new(data_dir: &str, cache_dir: &str) -> Self {
|
||||||
|
Self {
|
||||||
|
hits: HashMap::new(),
|
||||||
|
blocked: HashSet::new(),
|
||||||
|
active_connections: HashSet::new(),
|
||||||
|
data_dir: data_dir.to_string(),
|
||||||
|
cache_dir: cache_dir.to_string(),
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Load previous state from disk
|
||||||
|
pub fn load_from_disk(data_dir: &str, cache_dir: &str) -> Self {
|
||||||
|
let mut state = Self::new(data_dir, cache_dir);
|
||||||
|
let blocked_ips_file = format!("{data_dir}/blocked_ips.txt");
|
||||||
|
|
||||||
|
if let Ok(content) = fs::read_to_string(&blocked_ips_file) {
|
||||||
|
let mut loaded = 0;
|
||||||
|
for line in content.lines() {
|
||||||
|
if let Ok(ip) = line.parse::<IpAddr>() {
|
||||||
|
state.blocked.insert(ip);
|
||||||
|
loaded += 1;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
log::info!("Loaded {loaded} blocked IPs from {blocked_ips_file}");
|
||||||
|
} else {
|
||||||
|
log::info!("No blocked IPs file found at {blocked_ips_file}");
|
||||||
|
}
|
||||||
|
|
||||||
|
// Check for temporary hit counter cache
|
||||||
|
let hit_cache_file = format!("{cache_dir}/hit_counters.json");
|
||||||
|
if let Ok(content) = fs::read_to_string(&hit_cache_file) {
|
||||||
|
if let Ok(hit_map) = serde_json::from_str::<HashMap<String, u32>>(&content) {
|
||||||
|
for (ip_str, count) in hit_map {
|
||||||
|
if let Ok(ip) = ip_str.parse::<IpAddr>() {
|
||||||
|
state.hits.insert(ip, count);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
log::info!("Loaded hit counters for {} IPs", state.hits.len());
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
BLOCKED_IPS.set(state.blocked.len() as f64);
|
||||||
|
state
|
||||||
|
}
|
||||||
|
|
||||||
|
// Persist state to disk for later reloading
|
||||||
|
pub fn save_to_disk(&self) {
|
||||||
|
// Save blocked IPs
|
||||||
|
if let Err(e) = fs::create_dir_all(&self.data_dir) {
|
||||||
|
log::error!("Failed to create data directory: {e}");
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
let blocked_ips_file = format!("{}/blocked_ips.txt", self.data_dir);
|
||||||
|
|
||||||
|
match fs::File::create(&blocked_ips_file) {
|
||||||
|
Ok(mut file) => {
|
||||||
|
let mut count = 0;
|
||||||
|
for ip in &self.blocked {
|
||||||
|
if writeln!(file, "{ip}").is_ok() {
|
||||||
|
count += 1;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
log::info!("Saved {count} blocked IPs to {blocked_ips_file}");
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::error!("Failed to create blocked IPs file: {e}");
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Save hit counters to cache
|
||||||
|
if let Err(e) = fs::create_dir_all(&self.cache_dir) {
|
||||||
|
log::error!("Failed to create cache directory: {e}");
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
let hit_cache_file = format!("{}/hit_counters.json", self.cache_dir);
|
||||||
|
let hit_map: HashMap<String, u32> = self
|
||||||
|
.hits
|
||||||
|
.iter()
|
||||||
|
.map(|(ip, count)| (ip.to_string(), *count))
|
||||||
|
.collect();
|
||||||
|
|
||||||
|
match fs::File::create(&hit_cache_file) {
|
||||||
|
Ok(file) => {
|
||||||
|
if let Err(e) = serde_json::to_writer(file, &hit_map) {
|
||||||
|
log::error!("Failed to write hit counters to cache: {e}");
|
||||||
|
} else {
|
||||||
|
log::debug!("Saved hit counters for {} IPs to cache", hit_map.len());
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Err(e) => {
|
||||||
|
log::error!("Failed to create hit counter cache file: {e}");
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#[cfg(test)]
|
||||||
|
mod tests {
|
||||||
|
use super::*;
|
||||||
|
use std::net::{IpAddr, Ipv4Addr};
|
||||||
|
use std::sync::Arc;
|
||||||
|
use tokio::sync::RwLock;
|
||||||
|
|
||||||
|
#[tokio::test]
|
||||||
|
async fn test_bot_state() {
|
||||||
|
let state = BotState::new("/tmp/eris_test", "/tmp/eris_test_cache");
|
||||||
|
let ip1 = IpAddr::V4(Ipv4Addr::new(1, 2, 3, 4));
|
||||||
|
let ip2 = IpAddr::V4(Ipv4Addr::new(5, 6, 7, 8));
|
||||||
|
|
||||||
|
let state = Arc::new(RwLock::new(state));
|
||||||
|
|
||||||
|
// Test hit counter
|
||||||
|
{
|
||||||
|
let mut state = state.write().await;
|
||||||
|
*state.hits.entry(ip1).or_insert(0) += 1;
|
||||||
|
*state.hits.entry(ip1).or_insert(0) += 1;
|
||||||
|
*state.hits.entry(ip2).or_insert(0) += 1;
|
||||||
|
|
||||||
|
assert_eq!(*state.hits.get(&ip1).unwrap(), 2);
|
||||||
|
assert_eq!(*state.hits.get(&ip2).unwrap(), 1);
|
||||||
|
}
|
||||||
|
|
||||||
|
// Test blocking
|
||||||
|
{
|
||||||
|
let mut state = state.write().await;
|
||||||
|
state.blocked.insert(ip1);
|
||||||
|
assert!(state.blocked.contains(&ip1));
|
||||||
|
assert!(!state.blocked.contains(&ip2));
|
||||||
|
drop(state);
|
||||||
|
}
|
||||||
|
|
||||||
|
// Test active connections
|
||||||
|
{
|
||||||
|
let mut state = state.write().await;
|
||||||
|
state.active_connections.insert(ip1);
|
||||||
|
state.active_connections.insert(ip2);
|
||||||
|
assert_eq!(state.active_connections.len(), 2);
|
||||||
|
|
||||||
|
state.active_connections.remove(&ip1);
|
||||||
|
assert_eq!(state.active_connections.len(), 1);
|
||||||
|
assert!(!state.active_connections.contains(&ip1));
|
||||||
|
assert!(state.active_connections.contains(&ip2));
|
||||||
|
drop(state);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
168
src/utils.rs
Normal file
168
src/utils.rs
Normal file
|
@ -0,0 +1,168 @@
|
||||||
|
use std::collections::HashMap;
|
||||||
|
use std::hash::Hasher;
|
||||||
|
|
||||||
|
// Find end of HTTP headers
|
||||||
|
pub fn find_header_end(data: &[u8]) -> Option<usize> {
|
||||||
|
data.windows(4)
|
||||||
|
.position(|window| window == b"\r\n\r\n")
|
||||||
|
.map(|pos| pos + 4)
|
||||||
|
}
|
||||||
|
|
||||||
|
// Extract path from raw request data
|
||||||
|
pub fn extract_path_from_request(data: &[u8]) -> Option<&str> {
|
||||||
|
// Get first line from request
|
||||||
|
let first_line = data
|
||||||
|
.split(|&b| b == b'\r' || b == b'\n')
|
||||||
|
.next()
|
||||||
|
.filter(|line| !line.is_empty())?;
|
||||||
|
|
||||||
|
// Split by spaces and ensure we have at least 3 parts (METHOD PATH VERSION)
|
||||||
|
let parts: Vec<&[u8]> = first_line.split(|&b| b == b' ').collect();
|
||||||
|
if parts.len() < 3 || !parts[2].starts_with(b"HTTP/") {
|
||||||
|
return None;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Return the path (second element)
|
||||||
|
std::str::from_utf8(parts[1]).ok()
|
||||||
|
}
|
||||||
|
|
||||||
|
// Extract header value from raw request data
|
||||||
|
pub fn extract_header_value(data: &[u8], header_name: &str) -> Option<String> {
|
||||||
|
let data_str = std::str::from_utf8(data).ok()?;
|
||||||
|
let header_prefix = format!("{header_name}: ").to_lowercase();
|
||||||
|
|
||||||
|
for line in data_str.lines() {
|
||||||
|
let line_lower = line.to_lowercase();
|
||||||
|
if line_lower.starts_with(&header_prefix) {
|
||||||
|
return Some(line[header_prefix.len()..].trim().to_string());
|
||||||
|
}
|
||||||
|
}
|
||||||
|
None
|
||||||
|
}
|
||||||
|
|
||||||
|
// Extract all headers from request data
|
||||||
|
pub fn extract_all_headers(data: &[u8]) -> HashMap<String, String> {
|
||||||
|
let mut headers = HashMap::new();
|
||||||
|
|
||||||
|
if let Ok(data_str) = std::str::from_utf8(data) {
|
||||||
|
let mut lines = data_str.lines();
|
||||||
|
|
||||||
|
// Skip the request line
|
||||||
|
let _ = lines.next();
|
||||||
|
|
||||||
|
// Parse headers until empty line
|
||||||
|
for line in lines {
|
||||||
|
if line.is_empty() {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
if let Some(colon_pos) = line.find(':') {
|
||||||
|
let key = line[..colon_pos].trim().to_lowercase();
|
||||||
|
let value = line[colon_pos + 1..].trim().to_string();
|
||||||
|
headers.insert(key, value);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
headers
|
||||||
|
}
|
||||||
|
|
||||||
|
// Determine response type based on request path
|
||||||
|
pub fn choose_response_type(path: &str) -> &'static str {
|
||||||
|
if path.contains("phpunit") || path.contains("eval") {
|
||||||
|
"php_exploit"
|
||||||
|
} else if path.contains("wp-") {
|
||||||
|
"wordpress"
|
||||||
|
} else if path.contains("api") {
|
||||||
|
"api"
|
||||||
|
} else {
|
||||||
|
"generic"
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// Get current timestamp in seconds
|
||||||
|
pub fn get_timestamp() -> u64 {
|
||||||
|
std::time::SystemTime::now()
|
||||||
|
.duration_since(std::time::UNIX_EPOCH)
|
||||||
|
.unwrap_or_default()
|
||||||
|
.as_secs()
|
||||||
|
}
|
||||||
|
|
||||||
|
// Create a unique session ID for tracking a connection
|
||||||
|
pub fn generate_session_id(ip: &str, user_agent: &str) -> String {
|
||||||
|
let timestamp = get_timestamp();
|
||||||
|
let random = rand::random::<u32>();
|
||||||
|
|
||||||
|
// XXX: Is this fast enough for our case? I don't think hashing is a huge
|
||||||
|
// bottleneck, but it's worth revisiting in the future to see if there is
|
||||||
|
// an objectively faster algorithm that we can try.
|
||||||
|
let mut hasher = std::collections::hash_map::DefaultHasher::new();
|
||||||
|
std::hash::Hash::hash(&format!("{ip}_{user_agent}_{timestamp}"), &mut hasher);
|
||||||
|
let hash = hasher.finish();
|
||||||
|
|
||||||
|
format!("SID_{hash:x}_{random:x}")
|
||||||
|
}
|
||||||
|
|
||||||
|
#[cfg(test)]
|
||||||
|
mod tests {
|
||||||
|
use super::*;
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_find_header_end() {
|
||||||
|
let data = b"GET / HTTP/1.1\r\nHost: example.com\r\nUser-Agent: test\r\n\r\nBody content";
|
||||||
|
assert_eq!(find_header_end(data), Some(55));
|
||||||
|
|
||||||
|
let incomplete = b"GET / HTTP/1.1\r\nHost: example.com\r\n";
|
||||||
|
assert_eq!(find_header_end(incomplete), None);
|
||||||
|
}
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_extract_path_from_request() {
|
||||||
|
let data = b"GET /index.html HTTP/1.1\r\nHost: example.com\r\n\r\n";
|
||||||
|
assert_eq!(extract_path_from_request(data), Some("/index.html"));
|
||||||
|
|
||||||
|
let bad_data = b"INVALID DATA";
|
||||||
|
assert_eq!(extract_path_from_request(bad_data), None);
|
||||||
|
}
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_extract_header_value() {
|
||||||
|
let data = b"GET / HTTP/1.1\r\nHost: example.com\r\nUser-Agent: TestBot/1.0\r\n\r\n";
|
||||||
|
assert_eq!(
|
||||||
|
extract_header_value(data, "user-agent"),
|
||||||
|
Some("TestBot/1.0".to_string())
|
||||||
|
);
|
||||||
|
assert_eq!(
|
||||||
|
extract_header_value(data, "Host"),
|
||||||
|
Some("example.com".to_string())
|
||||||
|
);
|
||||||
|
assert_eq!(extract_header_value(data, "nonexistent"), None);
|
||||||
|
}
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_extract_all_headers() {
|
||||||
|
let data = b"GET / HTTP/1.1\r\nHost: example.com\r\nUser-Agent: TestBot/1.0\r\nAccept: */*\r\n\r\n";
|
||||||
|
let headers = extract_all_headers(data);
|
||||||
|
|
||||||
|
assert_eq!(headers.len(), 3);
|
||||||
|
assert_eq!(headers.get("host").unwrap(), "example.com");
|
||||||
|
assert_eq!(headers.get("user-agent").unwrap(), "TestBot/1.0");
|
||||||
|
assert_eq!(headers.get("accept").unwrap(), "*/*");
|
||||||
|
}
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_choose_response_type() {
|
||||||
|
assert_eq!(
|
||||||
|
choose_response_type("/vendor/phpunit/whatever"),
|
||||||
|
"php_exploit"
|
||||||
|
);
|
||||||
|
assert_eq!(
|
||||||
|
choose_response_type("/path/to/eval-stdin.php"),
|
||||||
|
"php_exploit"
|
||||||
|
);
|
||||||
|
assert_eq!(choose_response_type("/wp-admin/login.php"), "wordpress");
|
||||||
|
assert_eq!(choose_response_type("/wp-login.php"), "wordpress");
|
||||||
|
assert_eq!(choose_response_type("/api/v1/users"), "api");
|
||||||
|
assert_eq!(choose_response_type("/index.html"), "generic");
|
||||||
|
}
|
||||||
|
}
|
Loading…
Add table
Add a link
Reference in a new issue