在本教程中,我们将尝试了解机器学习中最重要的算法之一:随机森林算法。我们将看看是什么让随机森林如此特别,并使用 Python 在真实世界的数据集上实现它。 您可以在此处找到代码以及数据集。
集成学习集成方法是一种将来自多个机器学习算法的预测组合在一起以做出比任何单个模型更准确的预测的技术。由许多模型组成的模型称为集成模型。
集成学习主要分为两类:
Boosting 和 Bootstrap
1.BoostingBoosting 是指一组利用加权平均值将弱学习器变成更强学习器的算法。提升是关于团队合作的。每个运行的模型都决定了下一个模型将关注的功能。
顾名思义,提升意味着一个人正在向另一个人学习,这反过来又促进了学习。
2.BootstrapBootstrap 是指有放回的随机抽样。Bootstrap 使我们能够更好地理解数据集中的偏差和方差。自举涉及对数据集中的一小部分数据进行随机抽样。
Bagging 是一种通用过程,可用于降低那些具有高方差的算法的方差,通常是决策树。Bagging 使每个模型独立运行,然后在最后聚合输出而不优先于任何模型。
决策树的问题决策树对训练它们的特定数 ...
linux
未读处理目录的常用命令
sudo 代表是管理员
ls(英文全拼:list files): 列出目录及文件名
cd(英文全拼:change directory):切换目录
pwd(英文全拼:print work directory):显示目前的目录
mkdir(英文全拼:make directory):创建一个新的目录
rmdir(英文全拼:remove directory):删除一个空的目录
cp(英文全拼:copy file): 复制文件或目录
rm(英文全拼:remove): 删除文件或目录
rm -rf 删除文件夹
mv(英文全拼:move file): 移动文件与目录,或修改文件与目录的名称
git config --global user.name "ytkz11"
git config --global user.email "ytkz11@163.com"
删除原来的python
/usr/bin/
sudo rm -rf python
sudo ln -s /usr/local/bin/python3.5 /usr/bin/python
sudo ap ...
一个简单的深度学习模型,实现语义分割,数据将使用Kaggle的“云层分割卫星影像”。
以下是记录一下在jupyter notebook 上运行的结果
ffmpeg
未读Compress Size Of Vedioffmpeg -i input.mp4 -vcodec libx265 -crf 28 output.mp4
M4a Combine
ffmpeg -i "concat:first.m4a|second.m4a" -c copy out.m4a
FFmpeg 裁剪视频画面ffmpeg -i 1.mp4 -vf crop=480:250:0:40 -threads 5 -preset ultrafast -strict -2 outputname.mp4
m4a combine
ffmpeg -i "concat:0.m4a|1.m4a" -safe 0 -c copy out.m4a
合并左右 , 并且压低画质
ffmpeg -i 9.mp4 -i 10.mp4 -filter_complex hstack -crf 50 output.mp4
压低画质
ffmpeg -i 9.mp4 -crf 50 -threads 1 output.mp4
m4a to aac
ffmpeg -i in.m4a -acodec copy out.aa ...
在过去几年中,时间(图像频率)和空间分辨率(衡量图像的精细程度)呈指数级增长,航空航天业将继续以我们无法预测的方式发生变化。随着像素密度(每英寸像素数或 ppi)的增加,我们可以获得更清晰的图像和更重的数字图像文件。相反,随着像素密度的降低,我们会失去精度,但也会减少处理需求。这是当前数字图像分析中的一项基本权衡。
通过在农业等学科中使用遥感图像,我们能够以更有效的方式执行不同的任务:
检测植物病害
对土地覆盖(例如森林)和土地利用(例如农业)进行分类
通过识别大豆、玉米、小麦等不同作物来对作物类型进行分类。
通过计算特定区域作物的预期产量来估算作物产量
识别与健康作物争夺阳光和土壤养分的杂草
监测和预测土壤水分
评估除草剂、杀虫剂和杀菌剂的有效性
识别农作物和土壤中的污染物
监控播种过程的有效性
要了解这是如何工作的,我们必须首先先认识光谱图像。
看不见的看见作为人类,人眼只能看到电磁波谱的一小部分(我们称之为“可见光”),而事实是,几个世纪以来,我们只是通过一个小窗口来观察这个世界。
现代遥感图像可以测量各种波长,其中许多是我们肉眼看不见的 ...
计算机编程语言流派间的关系
摘自网络
计算机编程语言的分类:
机器语言:二进制代码
汇编语言:面向机器的程序设计语言
高级语言:按转换方式可分为两类:1.编译型语言; 2.解释型语言**||****按照客观系统的描述可分为两类:1.面向过程语言; 2.面向对象语言****||****按照编程范型可分为:1.命令式语言; 2.函数式语言; 3.逻辑式语言; 4.面向对象语言**
三种语言的优缺点:
机器语言:可读性、可移植性差,编程繁杂。直接执行,速度快,资源占用少;
汇编语言:
*不同的处理器有不同的汇编语言语法和编译器,编译的程序无法在不同的处理器上执行,缺乏可移植性,难于从汇编语言代码上理解程序设计意图,可维护性差,即使是完成简单的工作也需要大量的汇编语言代码,很容易产生bug,难于调试,使用汇编语言必须对某种处理器非常了解,而且只能针对特定的体系结构和处理器进行优化,开发效率很低,周期长且单调。*
*能够保持机器语言的一致性,直接、简捷,并能像机器指令一样访问、控制计算机的各种硬件设备,如磁盘、存储器、CPU、I/O端口等。使用汇编语言,可以访问所有 ...
RS_GUI开发
2020年底,把之前自己做的遥感算法重新整理一遍,包括了多光谱的预处理:辐射定标、大气校正、几何校正、镶嵌匀色、图像增强、配准、SAR的处理等。最近开始学习GUI制作,想开发出一个简陋版的RS软件。
目前使用pyside2做界面,后端算法完成了辐射定标、大气校正、几何校正、镶嵌、配准等多光谱影像算法,适用影像:Landsat 8 、Sentinel 2、高分一号、高分二号、高分四号、高分六号、资源01-02D数据(只接触到以上数据,后续再补充)。
SAR的处理包括1A级生成2A级数据,SAR处理算法开发进行不下去的原因:雷达的知识过于专业,后续有时间再查找论文进一步加强理论知识后再进行开发相应模块(生成DEM、INSAR等)。
高光谱数据:缺少相关数据,无法进行。
基础的RS软件的功能基本实现(参考国外开源项目),包括影像缩小放大,坐标显示,波段合成显示等。后续想利用opengl做出一个旋转的球,把数据显示到该球上。
目前处于后端算法和界面逻辑的整合阶段。
辐射定标、大气校正模块,利用6S算法,整合了Landsat 8 、Sentinel 2、高分一号、高分二号、高分 ...
个人角度看待当前以及今后遥感的需求是什么?
tips:因为我的水平有限,在这里记录一下感悟。
遥感属于技术还是属于科学?
以前刚接触遥感开始,就在想遥感图片和普通图片有什么区别?后面就知道了:1.多了几个波段2.额外存储了地理信息(经纬度、坐标系等)
所以,遥感图片是和普通手机拍的图片本质上没有区别。手机图片一般是真彩色格式,三个波段,也叫做三个通道,是利用手机硬件对这个世界的光的采集、成像。遥感影像,根据卫星传感器波段数的不同可以分为多光谱图像、高光谱图像;也可以根据传感器的波长划分为:可见光图像、微波图像。
遥感可以通过编程去实现其价值,其中计算机语言有很多种,但无论是C++还是python,亦或是JAVA,它们仅是某种语言工具,重点的还是算法思想,从计算机编程的角度思考遥感技术:
1.把影像以数组的形式读到内存中,一个波段看成一个二维矩阵,那多个波段看成不同光谱维度的三维矩阵xyz,xy代表空间维度,z是光谱维度。
如果影像的拍摄时间不一样,则变成了四维矩阵xyzt,xy代表空间维度,z是光谱维度,t是时间维度。
2.算法,和数字图像处理的方法差异不大,可以从数字图像处理入门,进 ...
import re
import os
import requests
from time import sleep
headers = {
"User-Agent": ("Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) "
"Gecko/20100101 Firefox/64.0")
}
def get_index(resolution, index=1):
url = f"https://bing.ioliu.cn/ranking?p={index}"
res = requests.get(url, headers=headers)
urls = re.findall('pic=(.*?)\\.jpg', res.text)
_old_resolution = urls[1].split("_")[-1]
return {url.split("/")[-1].replace(_old_resolution, resolution): ur ...
一.简介 GDAL(Geospatial Data Abstraction Library)是一个在X/MIT许可协议下的开源栅格空间数据转换库。该项目由Frank Warmerdam教授于1998年发起。 它利用抽象数据模型来表达所支持的各种文件格式。 它还有一系列命令行工具来进行数据转换和处理。
GDAL/OGR使用面向对象的C++语言编写,这令该库在支持百余种格式的同时,还具有很高的执行效率。 GDAL/OGR同时还提供多种主流编程语言的绑定,除了C和C++语言之外, 用户还可以在Perl、python、VB6、Ruby、Java、C#等语言中调用GDAL。
这里介绍一种快速安装gdal(python)的方法。
二.安装步骤 1.在网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/#gdal 下载对应python版本的whl文件。
下载whl文件后,打开命令行。注意:cmd的目录为whl文件的路径。下面介绍一种快速打开cmd的方法:
1.打开相应的文件夹,在文 ...









