信息处理技术员软考笔记(第三章:信息、数据处理)

一、信息处理

1、信息处理的一般过程

在这里插入图片描述

2、信息处理有关的规章制度

  1. 信息系统日常运行管理制度:机房管理与设备维护制度、突发事件处理制度、 信息备份、存档、整理和初始化制度。
  2. 信息系统文档管理制度:系统开发以文档描述为依据,实体运行和维护用文 档来支持。
  3. 信息系统运行安全和保密制度:防止系统被破坏,防止有意窃取信息资源。

3、信息收集

  1. 信息收集:是信息利用的第一步,且是关键的一步。信息收集工作的好坏, 直接关系到整个信息管理工作的质量。

    信息分成原始信息和加工信息。

    信息收集过程:制定信息收集计划-―设计收集提纲和表格(包括调查问卷)—―明确数据源、信息收集方式和方法—―实施信息收集工作(原始数据和二手数据)——形成信息收集成果。

  2. 信息的数据表示:米用一定的基本符号,使用一定的组合规则来表示信息。 计算机中采用的是二进制编码,其基本符号是0和1.

4、信息加工

  1. 信息加工:按照一定的顺序和方法进行分类、编码、存储、处理和传送,是
    对收集来的信息进行去伪存真、去粗取精、由表及里、由此及彼的加工过程。主要内容:
    (1)信息的清洗和整理(纠正可识别的错误、检查数据一致性、删除重复数 据、处理无效值和缺失值、进一步审查异常数据等。
    (2)信息的筛选和判别(筛选和判别假消息。
    (3)信息的分类和排序(信息分类和排序,以达到存储、检索、传递和使 用)
    (4)信息的分析和研究(信息分析、概括及研究计算)。
    (5)信息的编制(整理,增加编目和索引)。

5、信息传递和存储

  1. 信息传递:将信息从信息源传输给用户 的过程,信源、信宿、信道构成信 息传递的三要素。
  2. 信息存储:加工后的信息按照一定的格式和顺序存储在特定的载体中的一种信息活动。存储介质有纸质存储和电子存储等。

6、信息处理有关的规章制度

  1. 信息系统日常运行管理制度:机房管理与设备维护制度、突发事件处理制度、 信息备份、存档、整理和初始化制度。
  2. 信息系统文档管理制度:系统开发以文档描述为依据,实体运行和维护用文 档来支持。
  3. 信息系统运行安全和保密制度:防止系统被破坏,防止有意窃取信息资源。

7、信息处理实务

  1. 企业信息处理内容:
    (1)企业内部信息:企业产品信息,企业管理信息,设备、厂房和运力信 息,人员、知识和资产信息。
    (2)企业外部信息:市场环境信息、技术经济信息,企业合作信息。
  2. 企业信息工作管理:
    (1)企业信息资料管理:扩大信息收集的范围和种类、加强信息资料的加 工和报道,做好信息资料的研究和决策支持工作。
    (2)企业信息用户管理:了解用户的信息需求,提高信息服务的质量。
    (3)企业信息工作管理:信息管理规章制度的建立,信息人员的配备和管
    理,信息装备的配置,工作计划的制定。

二、数据收集

1、数据收集原则

  1. 数据收集原则:全面性原则(广泛、完整和全面);准确性原则(数据真实、可
    靠、最基本的要求);时效性原则(及时、迅速提供给使用者);尊重提供者原则(尊重调查者对象及尊重信息提供方权益)等。
    收集方式:
    (1)从文献获取信息(二手数据;
    (2)调查(普查和抽样调查,包括观察法访谈法、问卷调查法、实验法等)
    抽样调查法:一种非全面调查。
    普查:全面调查。
    观察法:通过感官或仪器设备观察事物的情况。
    访谈法/面谈:口头交谈,访谈者和被调查人员相互影响。
    问卷法:标准化程度比较高。
    实验法:控制条件观察某些因素对其他因素的影响。
    (3)建立情报网和感知网(RFID自动识别、传感器网络和互联网等)。

2、数据分类

  1. 数据分类:把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征 来对数据进行区别。
  2. 数据分类原则:稳定性(最稳定的本质特征);系统性(按内在规律系统化排列);可扩充性(留有余地,方便扩充);综合实用性(实际需求,总体最优);兼容性(国家、国际、行业标准)。

3、数据编码、校验

  1. 数据编码:为了实现计算机进行信息处理和数据库管理的目标,在数据分类 的基础上要进行数据编码。包括:
    (1)数值型数据的编码:根据该类数据的参照标准对变量赋予数值,如年 龄。
    (2)非数值数据的编码:确定编码规则后根据规则对变量赋予数值,如性 别。
    (3)缺失值的处理:用户缺失值(用户未勾选,用能识别的特殊数字0,9,99 等表示)、系统缺失值(输入数据空缺、输入非法字符等,用特殊符号*、# 等标记)。缺失值的两种处理方法:替代法(用统计命令或利用参数替代)、剔除法(剔除有缺失值的数据)。
  2. 数据校验:应用在许多场合,主要是为了减少、避免错误数据的产生,保证 数据的完整性。

4、 数据清洗

  1. 数据清洗:指发现并纠正数据文件中可识别的错误的最后一道程序。数据清洗利用有关技术处理数据的丢失值、越界值、不一致代码、重复数据等问题,删除或将其转化为满足数据质量要求的数据。

5、数据存储和检索

  1. 数据存储和检索
    (1)存储介质:硬盘、U盘、光盘、DVD、移动硬盘等。
    (2)存储方式:本地文件、数据库、云存储等。
    (3)数据检索排序与筛选。
  2. 数据分析和可视化 :
    数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
  3. 实施数据分析项目,其过程主要包括:明确分析目的和框架、数据收集、数据处理、数据分析、数据展现和撰写数据分析报告。
  4. 可视化:利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏 幕上显示出来,再进行交互处理的理论、方法和技术。